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在 过 去 20 年 里 ， 分 布 式 算法 一 直 是 备 受 关注 的 研究 课题 ， 本 书 是 这 个 领域 的 经 典 教科 书 ， 
曾 在 国外 多 所 大 学 被 广泛 使 用 。 
本 书 重点 讲解 点 到 点 消息 传递 模型 上 的 算法 ， 包 括 用 于 计算 机 通信 网 络 的 算法 。 还 分 析 其 
它 分 布 式 应 用 的 控制 算法 (波动 算法 、 广 播 算法 、 选 举 算法 、 终 止 检测 算法 、 匿 名 网 络 的 随机 
算法 ， 快 昭 算 法 、 死 锁 检 测算 法 和 同步 系统 算法 ) ， 涉 及 利用 分 布 式 算法 实现 容错 计算 。 本 书 
反映 了 当今 分 布 式 算法 最 新 技术 的 发 展 水 平 ， 对 于 进一步 研究 这 个 领域 提供 了 帮助 。 





作 在 荷兰 Utrecht 大 学 获得 博士 学 位 ， 现 任 Utrecht 大 学 
者 Gerard Tel 计算 与 信息 科学 学 院 助 理 教授 ， 其 主要 研究 方向 包括 
复杂 性 ， 压 缩 、 密 码 学 、 通 信和 编码 等 。 出 版 过 多 本 广 受 好 评 的 著作 。 
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本 书 详细 介绍 了 分 布 式 算法 及 其 理论 ， 结 合 大 量 定理 、 引 理 、 命 题 等 的 证 明 ， 讨 论 
了 点 到 点 消息 传递 模型 上 的 算法 、 计 算 机 通信 和 网络 中 实现 的 算法 ， 重 点 是 分 布 式 应 用 的 
控制 算法 (如 波动 算法 、 广 播 算 法 、 选 举 算法 、 同 步 系统 算法 等 )， 还 涉及 了 利用 分 布 式 
算法 实现 容错 计算 、 方 向 侦 听 和 故障 检测 器 等 方面 的 内 容 。 本 书 条 理 清晰 、 深 入 浅 出 ， 
适合 作为 大 学 本 科 高 年 级 和 研究 生 的 分 布 式 算法 课程 的 教材 和 参考 书 ， 对 于 具有 实践 经 
验 的 专业 人 员 也 大 有 帮助 。 


Gerard Tel: Introduction to Distributed Algorithms, Second Edition(ISBN 0-521- 
79483-8). 

Originally published by Cambridge University Press in 1994, 2000. 

This Chinese edition is published with the permission of the Syndicate of the Press of 
the University of Cambridge, Cambridge, England. 

Copyright © 2004 by Cambridge University Press. 

This edition is licensed for distribution and sale in the People’s Republic of China only, 


excluding Hong Kong, Taiwan and Macao and may not be distributed and sold elsewhere. 
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在 过 去 几 年 里 ， 分 布 式 系统 和 分 布 式 信息 处 理 得 到 广泛 关注 。 几 乎 每 一 所 大 学 都 会 开设 
至 少 一 门 关于 分 布 式 算法 设计 的 课程 。 出 现 了 许多 关于 分 布 式 系统 原理 方面 的 书籍 ， 例 如 
Tanenbaum [Tan96] 和 Sloman & Kramer [SK87] ， 但 这 些 书 籍 主 要 是 针对 结构 而 不 是 算法 。 
自从 本 书 第 1 版 问世 以 来 ， 相 继 出 版 的 分 布 式 算法 方面 的 著作 有 Barbosa [Bar96] 、Lynch 
[Lyn96] 和 Attiya & Welch [AW98] . 

因为 算法 是 计算 机 应 用 的 基础 ， 因 此 需要 一 本 专门 介绍 分 布 式 算法 的 书 。 本 书 的 目的 是 
展示 过 去 20 年 来 分 布 式 算法 方面 的 诸多 理论 。 本 书 可 作为 分 布 式 算法 1~2 学 期 的 教学 用 书 ， 一 
学 期 的 课程 可 由 教师 从 本 书 中 选择 若干 专题 来 安排 。 

本 书 也 可 作为 相关 专业 的 工程 师 和 从 事 分 布 式 系统 研究 的 科研 人 员 的 参考 书 。 

练习 。 每 章 〈 除 第 1 章 和 第 13 章 ) 后 面 附 有 一 些 习 题 和 项 目 。 项 目 通 常 要 求 读者 开发 涉及 
该 章 内 容 的 一 些 应 用 。 大 多 数 情况 下 ， 没 有 提供 “答案 ”。 

致谢 。 本 书 经 以 下 人 士 的 仔细 校对 。 他 们 是 : Erwin Bakker, Hans Bodlaender, Stefan 
Dobrev, Petra van Haaften, Ted Herman, Jan van Leeuwen, Patrick Lentfert, Friedemann 
Mattern, Pascale van der Put, Peter Ružička, Martin Rudalics, Anneke Schoone 和 Kaisa Sere. 
他 们 对 手稿 质量 的 改进 提出 了 有 益 的 意见 。 此 外 ， 在 Utrecht 大 学 选修 秋季 “分 布 式 算法 ” 课 
程 的 学 生 们 也 提供 了 有 益 的 建议 。 计 算 机 科学 系 为 所 需 的 文本 处 理 和 输出 提供 了 技术 支持 。 
Susan Parkinson 进 行 了 文字 编辑 。 


Gerard Tel 
1994 年 4 月 /2000 年 2 月 


译 者 FF 


本 书 是 关于 分 布 式 算法 的 最 优秀 的 著作 之 一 。 它 系统 地 阐述 了 分 布 式 算法 设计 的 理论 、 


方法 和 应 用 实例 。 目 前 ， 国 内 尚 缺少 专门 介绍 分 布 式 算法 的 著作 。 我 们 希望 本 书 能 对 我 国 高 
等 院 校 的 计算 机 教育 有 所 帮助 。 


在 过 去 的 二 十 年 里 ， 分 布 式 算法 一 直 是 备 受 关注 的 研究 课题 。 这 本 成 功 的 教科 书 的 第 二 


版 ， 介 绍 了 分 布 式 算法 研究 领域 的 最 新 进展 。 新 增 了 两 章 关于 方向 侦 听 和 故障 检测 器 的 内 容 ， 
代表 了 当今 该 领域 最 新 技术 发 展 水 平 。 


本 书 分 四 部 分 : 协议 (第 2 章 ~ 第 5 章 )、 基 本 算法 (第 6 章 ~ 第 12 章 )、 容 错 (第 13 章 ~ 第 


17 章 ) 和 附 求 (附录 A、 附 录 B)。 书 中 内 容 全 面 阐述 了 过 去 20 年 来 分 布 式 算法 方面 的 诸多 理 
论 。 本 书 主要 内 容 及 特点 如 下 : 


“第 一 部 分 介绍 了 分 布 式 系统 和 通信 网 络 的 基本 概念 ， 讨 论 了 平衡 滑动 窗口 协议 和 基于 计 
时 器 的 协议 ， 以 严 间 简明 的 形式 对 路 由 算法 作 了 系统 论述 ， 最 后 讨论 了 缓冲 区 有 限时 无 
死 锁 的 包 交 换 问 题 。 

“第 二 部 分 讨论 了 基本 算法 。 包 括 : 波动 算法 、 遍 历 算法 、 广 播 算 法 、 选 举 算 法 、 终 止 检 
测算 法 、 匿 名 网 络 的 随机 算法 、 快 照 算法 、 方 向 侦 听 与 定向 算法 、 死 锁 检 测算 法 和 同步 
系统 算法 。 

“第 三 部 分 讨论 了 容错 问题 。 引 入 了 健壮 算法 和 稳定 算法 的 概念 。 证 明了 同步 系统 的 健壮 
性 要 比 异 步 系统 更 大 。 最 后 讨论 了 故障 检测 和 稳定 算法 。 

“第 四 部 分 介绍 了 伪 代 码 使 用 约定 、 图 和 网 络 中 的 一 些 基 本 概念 和 常用 术语 。 

所 有 算法 既 给 出 严格 的 数学 定义 及 类 Pascal 语 言 的 形式 描述 ， 又 以 算法 不 变 式 作 为 手段 给 


出 算法 正确 性 的 形式 证 明 ， 充 分 反映 了 作者 在 分 布 式 算法 方面 的 造 讶 。 


本 书 适合 作为 高 等 院 校 分 布 式 算法 、 分 布 式 计算 课程 的 本 科 生 和 研究 生 教材 ， 同 时 可 作 


为 从 事 分 布 式 系统 设计 与 应 用 的 专业 人 员 的 参考 书 。 


由 于 时 间 较 紧 及 译 者 水 平 有 限 ， 译 文 难免 有 错误 及 不 妥 之 处 ， 恳 请 读者 批评 指正 。 


Ein 
西安 电子 科技 大 学 计算 机 学 院 
2003 年 12 月 
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霍 红 卫 ，1963 年 8 月 出 生 ， 博 士 。 现 为 西安 电子 科技 大 学 计算 机 学 院 教授 。 
主要 研究 方向 : 算法 分 析 与 设计 、 并 行 与 分 布 式 计 算 、 遗 传 算法 、 生 物 信息 
学 中 的 优化 算法 。 著 作 有 : 《算法 设计 与 分 析 》、《 并 行 分 类 算法 》 和 


«Exercises & Solutions on Algorithms}. 








作 者 序 


With great pleasure I welcome this publication of the Chinese translation of my book——— . 
«Introduction to Distributed Algorithms). 

In recent years, the flourishing economy of China greatly promotes the development of 
science and technology. Ceoperation between China and other countries in IT industry is 
increasingly strengthened. More and more Chinese researchers, along with their counterparts in 
other countries, participate in various distributed computing projcets both at home and abroad. 

All these distributed computing projects need algorithms for cooperation, coordination, 
information exchange, overcoming failures, etc. 

The topics discussed in this text will promote a fundamental style of thinking about 
algorithms, mathematical proofs, specifications and models They may not only be helpful in 
studying existing methods, but also lay a intellectual foundation for studying new problems. I 
hope that many Chinese readers will find the book useful. 

Acknowledgements: 

Thanks are due to the China Machine Press for planning and printing this edition of my book 
in the Chinese language. 

Special thanks go to Prof. Hongwei Huo of Xidian University for she has undertaken the 
enormous work of translating this book into the Chinese language. 


Gerard Tel, June 2004 


欣 闻 我 的 著作 一 一 《分 布 式 算法 导论 》 中 文 版 即将 出 版 ， 非 常 高 兴 。 

最 近 几 年 ， 繁 荣 的 中 国 经 济 极 大 地 促进 了 科学 技术 的 发 展 。IT 界 的 中 外 合作 日 益 加 强 。 
越 来 越 多 的 中 国 研究 人 员 与 国外 同行 一 起 参加 到 国内 外 各 种 分 布 式 计算 工程 中 。 所 有 这 些 分 
布 式 计算 工程 都 需要 协调 合作 、 信 息 交换 和 故障 排除 的 算法 。 

本 书 讨 论 的 课题 将 促进 对 算法 、 数 学 证 明 、 说 明 以 及 模型 的 根本 思考 。 它 们 不 仅 对 研究 
已 有 的 方法 大 有 帮助 ， 而 且 会 为 研究 新 的 问题 商定 知识 基础 。 我 希望 广大 中 国 读者 会 从 本 书 
中 受益 。 


致谢 : 
非常 感谢 机 械 工业 出 版 社 策划 和 出 版 了 本 书 的 中 文 版 。 
还 要 特别 感谢 西安 电子 科技 大 学 计算 机 学 院 的 填 红 卫 教 授 承 担 了 本 书 的 翻译 工作 。 


Gerard Tel 
2004 年 6 月 
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出 版 者 的 话 


文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 右 出 、 独 领 风 台 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭 棵 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 场 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意 识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 迟 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 杜 选 出 Tanenbaum Stroustrup, Kernighan, 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 
究 及 刻 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 则 力 衷 助 ， 国 内 的 专家 不 仅 提 供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 ,，“ 计 算 机 科学 从 书 ” 已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 和 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “计算 机 科学 丛书” 之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
“全 美 经 典 学 习 指导 系列 ”。 为 了 保证 这 三 套 丛书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 科 学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交通 大 学 、 中 国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 出 大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 潮 
北 工学 院 、 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意见 和 出 版 监督 。 

这 三 套 丛 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
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的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. I. T.，Stanford ，U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵 盖 了 程序 设计 、 数 据 结 构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课 程 ， 而 且 各 具 特 色 一 有 的 出 自 语 言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 训 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 堂 而 入 宝 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzedu@hzbook.com 

联系 电话 : (010) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 100037 
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第 1 章 导论 : 分 布 式 系统 


本 章 简 要 介绍 了 研制 分 布 式 算法 所 依据 的 硬件 和 软件 系统 。 阐 述 了 研究 分 布 式 算法 的 原 
因 。 通 过 一 个 分 布 式 系统 表明 若干 台 计 算 机 或 处 理 器 相互 协作 完成 计算 机 应 用 。 分 布 式 系统 
的 定义 不 仅 包括 广 域 计算 机 通信 和 网， 还 有 局 域 网 、 多 处 理 器 计算 机 (每 一 台 处 理 器 都 有 自己 
的 控制 单元 ) 及 协同 处 理 系统 。 

1.1 节 介绍 了 各 种 类 型 的 分 布 式 系 统 ， 讨 论 了 使 用 分 布 式 系统 的 原因 ， 给 出 了 现 有 分 布 式 
系统 的 例子 。 然 而 ， 本 书 的 主题 既 不 是 这 些 系统 的 构成 ， 也 不 是 如 何 使 用 它们 ， 而 是 它们 的 
工作 原理 。 同 时 ， 对 分 布 式 系统 中 所 使 用 的 算法 做 专门 研究 。 

当然 ， 仅 研究 分 布 式 系统 的 算法 是 不 能 完全 理解 它 的 整体 结构 和 操作 的 。 为 了 充分 理解 
这 一 系统 ， 还 必须 研究 硬件 及 软件 的 整个 体系 结构 ， 即 把 功能 划分 成 模块 。 同 时 还 需要 研究 
与 程序 设计 语言 性 质 有 关 的 重要 问题 ， 而 程序 设计 语言 可 用 于 构建 分 布 式 系统 中 的 软件 ，1.2 
节 将 会 讨论 这 些 主题 。 

现 有 的 一 些 关 于 分 布 式 系统 方面 的 优秀 著作 ， 比 如 ，Tanenbaum [Tan96] 、Sloman and 
Kramer [SK87] 、Bal [Bal90] 、Coulouris and Dollimore [CD88] or Goscinski [Gos91] 
侧重 于 系统 的 体系 结构 和 语言 方面 。 正 如 已 经 提 到 的 那样 ， 本 书 主要 讨论 分 布 式 系统 的 算法 。 
1.3 节 解释 了 分 布 式 算法 设计 与 集中 式 算 法 设计 的 差异 。 概 略 地 描述 了 分 布 式 算法 的 研究 领域 ， 
并 概括 了 本 书 的 其 余部 分 。 


1.1 分 布 式 系统 的 定义 


本 章 中 的 “分 布 式 系统 ”表示 自主 计算 机 、 进 程 或 者 处 理 器 互 连 的 集合 。 计 算 机 、 进 程 
或 者 处 理 器 称 为 分 布 式 系统 中 的 节点 (node) (在 后 续 章节 中 ， 将 使 用 更 具 技术 性 的 表示 方 
法 ， 参 见 定义 2.6)。“ 自 主 性 ”是 指 节点 必须 至 少 配备 自己 专用 的 控制 单元 。 因 此 ， 单 指令 多 
数据 (SIMD) 模型 的 并 行 计算 机 并 不 是 分 布 式 系统 。“ 互 连 性 ”是 指 节点 之 间 必 须 能 够 交换 
信息 。 

由 于 (软件 ) 进程 能 够 起 着 系统 中 节点 的 作用 ， 因 此 这 个 定义 包括 了 作为 通信 进程 集合 
而 构造 的 软件 系统 ， 即 使 是 运行 在 单一 硬件 装置 上 。 然 而 ， 在 大 多 数 情况 下 ， 一 个 分 布 式 系 
统 至 少 包 含 几 个 处 理 器 ， 这 些 处 理 器 通过 通信 硬件 互 连 。 

在 文献 中 可 以 看 到 对 分 布 式 系统 更 严格 的 定义 。 例 如 ，Tanenbaum[Tan96] 认 为 ， 仅 当 系 
统 中 自主 性 节点 的 存在 对 用 户 是 透明 的 时 候 ， 一 个 系统 才 称 为 分 布 式 系统 。 从 这 种 意义 上 讲 ， 
分 布 式 系统 就 像 是 一 个 虚拟 的 、 单 一 的 计算 机 系统 ， 但 要 实现 这 种 透明 性 ， 需 要 开发 复杂 的 
分 布 式 控制 算法 。 


1.1.1 动机 
分 布 式 计算 机 系统 比 顺序 系统 更 可 取 ， 或 者 说 ， 它 们 的 使 用 是 必然 的 。 我 们 将 对 其 原因 进 
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行 分 析 ， 下 面 的 分 析 只 是 部 分 原因 。 分 布 式 系统 的 选择 受到 下 列 诸多 因素 的 影响 ， 有 时 可 能 
源 于 其 他 原因 ， 但 其 优势 随 之 显现 。 分 布 式 系统 的 特征 可 能 会 随 着 其 存在 的 形式 不 同 而 不 同 。 

1.1.2 节 1.1.6 节 将 会 更 详细 地 讨论 这 些 问题 。 

(1) 信息 交换 在 60 年 代 ， 当 多 数 大 学 和 公司 开始 拥有 自己 的 大 型 机 时 ， 产 生 了 在 不 同 
计算 机 间 进 行 数据 交换 的 需求 。 不 同 机 构 的 人 员 通 过 这 些 机 构 的 计算 机 交换 数据 ， 使 合作 变 
得 更 为 便利 。 从 而 引发 了 对 所 谓 的 广域网 (wide-area network, WAN) 的 开发 。 当 今 因特网 
的 前 身 ARPANET 于 1969 年 12 月 投入 使 用 。 广 域 网 (有 时 称 远程 网 络 ，long-haul network) 中 
所 连接 的 计算 机 通常 都 配 有 用 户 所 需 的 各 种 设备 ， 如 备份 存储 器 、 磁 盘 、 各 种 应 用 程序 及 打 
印 机 等 。 

后 来 ， 计 算 机 体积 变 得 越 来 越 小 ， 价 格 越 来 越 便宜 ， 很 快 ， 每 一 个 机 构 都 有 了 许多 计算 
机 ,现在 ,常常 是 人 手 一 台 计 算 机 (个 人 计算 机 或 工作 站 )。 因 此 ， 机 构 人 员 间 的 信息 (电子 ) 
交换 要 求 自主 性 计算 机 互 连 。 甚 至 有 的 个 人 或 家 庭 将 多 台 计 算 机 连接 成 一 小 型 个 人 家 庭 网 络 
也 是 很 常见 的 。 

(2) 资源 共享 ”尽管 由 于 计算 机 的 价格 便宜 ， 机 构 可 为 每 一 位 员工 提供 一 台 个 人 计算 机 ， 
但 对 于 外 围 设备 (如 打印 机 、 存 储 设备 和 磁盘 等 ) 情况 却 并 非 如 此 。 在 较 小 规模 内 ， 每 台 计 
算 机 可 以 依靠 专用 服务 器 提供 编译 器 和 其 他 应 用 程序 。 此 外 ， 在 所 有 计算 机 上 进行 应 用 程序 
和 相关 文件 资源 的 复制 ， 则 效率 低下 ; 除了 浪费 磁盘 空间 ， 还 会 引起 不 必要 的 维护 问题 。 因 
此 ， 用 户 计算 机 要 依靠 专用 节点 进行 打印 输出 和 磁盘 服务 。 在 一 个 组 织 内 部 连接 而 成 的 计算 
机 网 络 称 为 局 域 网 (local-area network, LAN). 

对 于 机 构 而 言 ， 建 立 小 型 计算 机 组 成 的 网 络 ， 而 不 是 购买 大 型 机 ， 不 仅 是 为 了 降低 系统 
成 本 ， 而 且 是 使 系统 具有 可 扩充 性 。 首先， 较 之 大 型 计算 机 ， 小 型 计算 机 系统 有 更 好 的 性 能 
价格 比 ; 虽然 典型 的 大 型 机 要 比 个 人 计算 机 快 50 倍 ， 但 其 价格 却 是 个 人 计算 机 的 500 倍 之 多 。 
其 次 ， 如 果 一 个 小 型 计算 机 系统 的 容量 不 足 ， 可 根据 机 构 需要 在 网 络 中 增加 机 器 (文件 服务 
器 、 打 印 机 和 工作 站 )。 而 如 果 单机 系统 的 容量 不 够 ， 则 只 能 更 换 。 

(3) 通过 复制 提高 可 靠 性 分布 式 系统 较 之 单机 系统 更 具 可 靠 性 。 这 是 因为 它们 有 局 部 
故障 (partial-failure) 的 性 质 。 这 表明 ， 如 果 系 统 中 的 某 些 节点 发 生 故 障 ， 其 他 节点 仍 可 正 党 
运行 并 且 能 够 接管 故障 的 部 分 。 而 单机 系统 的 故障 则 会 影响 整个 系统 ， 在 这 种 情况 下 ， 系 统 
不 可 能 继续 运行 。 因 此 ， 在 设计 高 可 靠 性 计算 机 系统 时 ， 分 布 式 体系 结构 常常 更 受到 关注 。 

高 可 靠 性 系统 一 般 有 多 个 处 理 器 ， 是 运行 一 个 应 用 程序 的 单 处 理 器 的 二 至 四 倍 用 程序 并 
利用 表决 机 制 决定 机 器 的 输出 。 因 此 ， 当 系统 的 某 个 部 件 发 生 故 障 时 ， 要 使 分 布 式 系统 正常 
运行 ， 需 要 相当 复杂 的 算法 支持 。 

(4) 通过 并 行 化 提高 性 能 由 于 分 布 式 系 统 中 存在 多 处 理 器 ， 人 们 可 以 把 计算 密集 的 作 
业 进 行 划分 ， 并 分 布 到 车 干 台 处 理 器 上 分 别处 理 ， 来 减少 作业 的 处 理 时 间 。 

并 行 计 算 机 的 工作 原理 就 是 如 此 ， 但 通过 将 任务 分 配 到 其 他 工作 站 上 进行 并 行 处 理 ， 局 
域 网 的 用 户 也 可 受益 。 

(5) 通过 规范 简化 设计 计算 机 系统 设计 相当 复杂 ，、 尤 其 是 有 相当 多 的 功能 要 求 时 。 将 
系统 分 成 模块 ， 可 简化 系统 设计 ， 每 一 模块 实现 部 分 功能 ， 并 可 与 其 他 模块 通信 。 
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通过 定义 抽象 数据 类 型 和 不 同 任务 过 程 ， 可 以 得 到 独立 的 程序 模块 。 也 可 将 一 个 大 的 系 
统 定义 为 协同 进程 的 集合 。 在 这 两 种 情况 下 ， 模 块 都 可 以 在 单一 计算 机 上 执行 。 但 在 一 个 局 
域 网 中 可 能 会 有 不 同类 型 的 计算 机 ， 如 ， 有 一 台 配 备 专门 进行 密集 数值 计算 (number 
crunching) 的 硬件 的 计算 机 ， 有 一 台 带 有 制图 硬件 的 计算 机 ， 还 有 一 台 配 备 了 磁盘 等 设备 。 


1.1.2 计算 机 网 络 


计算 机 网 络 是 由 通信 设备 把 多 个 计算 机 互 连 而 成 的 计算 机 集合 ， 通 过 这 些 设备 实现 信息 
交换 。 交 换 是 通过 接收 和 发 送信 息 实现 的 。 计 算 机 网 络 与 分 布 式 系统 的 定义 不 谋 而 合 。 根 据 
计算 机 之 间 的 距离 ， 计 算 机 网 络 可 分 为 广域网 和 局 域 网 。 

广域网 通常 连接 不 同 机 构 (各 行业 、 大 学 之 间 等 ) 的 计算 机 。 节 点 间 的 物理 距离 不 少 于 
10 公 里 。 网 络 中 的 每 一 节点 是 一 台 完整 的 计算 机 ， 包 括 所 有 的 外 围 设备 和 相当 数量 的 应 用 程 
序 。 广 域 网 的 主要 目标 是 实现 不 同 节点 间 用 户 的 信息 交换 。 

局 域 网 通常 是 连接 某 一 机 构 内 部 的 计算 机 。 节 点 间 的 物理 距离 不 大 于 10 公 里 。 网 络 中 的 
节点 可 以 是 工作 站 、 文 件 服务 器 或 者 打印 服务 器 ， 即 机 构 内 部 的 用 于 特定 功能 的 相对 较 小 的 
专用 工作 站 。 局 域 网 的 主要 目标 是 实现 信息 交换 和 资源 共享 。 

这 两 种 类 型 的 网 络 的 界限 并 不 总 能 清晰 界定 。 从 算法 观点 来 看 ， 这 种 区 分 不 是 很 重要 。 
因为 所 有 计算 机 网 络 中 的 算法 类 似 。 以 下 列 出 与 算法 开发 有 关 的 因素 。 

(1) 可 靠 性 参数 ”在 广域网 中 ,不 能 忽视 消息 传递 过 程 中 发 生 错误 的 可 能 性 。 通 常 ， 广 
域 网 的 分 布 式 算法 就 设计 成 要 处 理 这 种 可 能 性 。 局 域 网 就 可 靠 得 多 。 在 算法 设计 时 ， 通 常 假 
设 通信 是 完全 可 靠 的 。 然 而 ， 在 这 种 情况 下 ， 出 错 的 不 可 能 事件 可 能 会 难以 察觉 地 发 生 ， 并 
导致 系统 操作 错误 。 

(2) 通信 时 间 ”广域网 中 的 消息 传输 时 间 要 比 局 域 网 中 的 消息 传输 时 间 大 若干 数量 级 。 
在 广域网 中 ， 较 之 消息 的 传输 时 间 ， 消 息 的 处 理 时 间 几 乎 可 以 忽略 。 

(3) 同一 性 ”即使 在 局 域 网 中 ， 所 有 的 节点 也 未 必 相 同 。 通 常 在 一 个 机 构 内 部 ， 可 能 会 
狗 同 采用 共同 的 软件 和 协议 。 在 广域网 中 ， 有 多 种 协议 ， 这 就 使 得 在 不 同 协议 间 转 换 和 设计 
出 能 兼容 不 同 标准 的 软件 变 得 相当 困难 。 

(4) 互信 在 同一 机 构 内 部 ， 所 有 用 户 都 互相 信任 。 但 在 广域网 中 ， 决 不 是 这 种 情况 。 
广域网 需要 开发 安全 算法 ， 防 范 其 他 节点 非法 用 户 的 入 侵 。 

1.1.3 节 和 1.1.4 节 分 别 简要 讨论 了 广域网 络 和 局 域 网 络 。 


1.1.3 广域网 络 


1. 发 展 历 史 

在 开发 广域网 络 的 过 程 中 ， 大 量 早 期 开创 性 的 工作 是 在 美国 国防 部 的 高 级 研究 计划 局 
(Advanced Research Projects Agency, ARPA) 的 一 个 项 目 中 完成 的 。1969 年 ，ARPANET 投 
人 运行 。 当 时 连接 了 4 个 节点 。 现 在 这 个 网 络 已 增长 到 数 百 个 节点 。 利 用 类 似 的 一 些 技术 
(MILNET、CYPRESS 等 )， 还 建立 了 其 他 一 些 网 络 。 ARPANET 包 括 一 些 特殊 节点 ( 称 为 接 
口 信息 处 理 器 ，IMP)， 其 惟一 目的 是 处 理 大量 信 息 。 

当 UNIX ”系统 广泛 流行 时 ， 人 们 意识 到 需要 在 不 同 UNIX 机 器 间 进 行 信息 交换 。 为 了 达 


日 UNIX 是 AT&T 贝 尔 实 验 宝 的 注册 商标 。 





4 RIF Fie: JARAG 


到 这 一 目的 ， 编 写 了 uucp (UNIX-to-UNIX CoPy) 程序 。 使 用 此 程序 ， 通 过 电话 线 就 可 以 进 
行文 件 交 换 ， 称 为 UUCP 网 络 的 UNIX 用 户 网 络 迅速 出 现 。 由 于 ARPANET 属 于 国防 部 ， 仅 有 
某 些 机 构 可 以 与 之 相连 ， 因 此 80 年 代 ， 开 发 出 另 一 个 主要 的 网 络 ， 称 为 BITNET。 

如 今 ， 所 有 这 些 网 络 都 是 互 连 的 ; 有 一 些 节 点 连接 了 两 种 网 络 ( 称 为 网 关 )， 人 允许 在 不 同 
网 络 的 节点 之 间 进 行 信息 交换 。 统 一 地 址 空间 和 通用 协议 的 引入 把 网 络 变 成 一 个 单一 的 虚拟 
网 络 ， 通 常 称 为 因特网 。 不 同 于 “单一 ”网 络 ， 因 特 网 有 许多 用 户 ， 并 且 没 有 一 个 权威 机 构 。 
但 其 组 织 上 的 多 样 性 对 于 用 户 是 仔细 隐藏 的 。 作 者 的 邮件 地 址 (gerard@cs.uu.nl ) 并 没有 提 
供 其 部 门 所 连接 的 网 络 的 信息 。 

2. 组 织 和 算法 上 的 问题 

广域网 总 是 被 组 成 点 对 点 网 络 。 这 表明 ， 只 有 通过 一 种 专门 用 于 这 两 个 节点 的 连接 机 制 ， 
才 会 发 生 一 对 节点 间 的 通信 。 这 种 装置 可 以 是 电话 线 、 光 纤 或 者 卫星 网 等 。 点 对 点 的 互 连 结 
构 可 以 用 图 直观 地 表示 出 来 ， 用 圆圈 或 方 框 表示 网 络 中 的 节点 ， 节 点 之 间 的 边 表示 两 个 节点 
间 的 通信 线路 ， 如 图 1-1 所 示 。 用 更 技术 化 的 语言 ， 用 图 表示 结构 ， 其 中 边 代表 网 络 的 通信 线 
路 。 关 于 图 论 中 的 一 些 术语 在 附录 B 中 给 出 。 


@ 节点 


一 一 通信 线路 


图 1-1 点 对 点 网 络 的 一 个 例子 


广域网 的 主要 目的 是 进行 信息 交换 ， 如 电子 邮件 、 电 子 公告 和 远程 文件 与 数据 库 访问 。 
通过 一 个 应 用 程序 : 网 页 浏览 器 ， 可 以 使 用 大 多 数 服务 。 要 完成 一 个 能 实现 这 些 目标 的 适合 
的 通信 系统 ， 需 要 解决 下 列 算法 问题 ， 其 中 一 些 问题 在 本 书 第 一 部 分 讨论 。 

(1) 点 对 点 数据 交换 的 可 靠 性 〈 第 3 章 ) ”通过 连接 两 节点 间 的 线路 进行 数据 交换 ， 必 须 
处 理 可 能 会 发 生 的 线路 不 可 靠 问 题 。 由 于 大 气 噪声 、 动 力 受 损 以 及 其 他 的 物质 环境 影响 ， 通 
过 线路 所 发 送 的 消息 可 能 只 接收 到 一 部 分 ， 其 至 丢失 。 因 此 必须 辨别 这 些 传输 故障 并 纠正 。 

这 个 问题 不 仅 发 生 在 用 通信 线路 直接 相连 的 两 点 间 ， 而 且 发 生 在 借助 中 间 节 点 通信 的 未 
直接 相连 的 节点 之 间 。 在 这 种 情况 下 ， 问 题 更 复杂 ， 因 为 消息 到 达 的 次 序 可 能 与 发 送 次 序 不 
同 ， 可 能 在 很 长 时 间 以 后 到 达 或 者 被 复制 。 

(2) 通信 路 径 的 选择 (第 4 章 ) ”在 点 对 点 的 网 络 中 ， 由 于 费用 昂贵 ， 不 可 能 在 每 一 对 节 
点 之 间 都 提供 通信 线路 。 因 此 ， 某 些 节 点 必须 依靠 其 他 节点 进行 通信 。 路 由 问题 所 关注 的 是 
如 何在 要 通信 的 节点 之 间 选 择 一 条 (或 多 条 ) 路 径 。 所 用 的 路 径 选举 算法 与 节点 命名 模式 有 
关 ， 例 如 ， 某 节点 用 于 向 另 一 个 节点 发 送 消息 的 地 址 格式 。 中 间 节 点 的 路 径 选 择 利 用 这 一 地 
址 来 进行 ， 而 如 果 能 将 拓扑 信息 “编码 ”在 地 址 中 ， 就 能 选择 更 有 效 的 路 径 。 

(3) 拥塞 控制 ”如 果 同 时 传送 大 量 信息 ， 通 信 网 络 的 吞吐 量 就 会 急剧 下 降 。 必 须 控制 各 
节点 所 产生 的 信息 ， 并 使 其 适合 网 络 的 可 用 容量 。 文 献 [Tan96，5.3 节 ] 讨论 了 几 种 避免 拥 
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塞 的 方法 。 i ' 

(4) 死 锁 预 防 (第 5 章 ) ”点 对 点 的 网 络 有 时 称 为 存储 转发 (Store-and-forward) 网 络 。 
因为 信息 发 送 所 经 过 的 中 间 节 点 必须 将 收 到 的 信息 存储 起 来 ， 然 后 再 转发 到 下 一 个 节点 。 由 
于 中 间 节 点 可 用 于 这 一 目的 的 存储 空间 是 有 限 的 ， 因 此 必须 仔细 管理 存储 空间 ， 预 防 死 锁 的 
发 生 。 在 死 锁 发 生 时 ， 有 许多 消息 不 能 被 转发 ， 因 为 下 一 节点 的 存储 空间 完全 被 其 他 消息 所 
占据 。 

(5) 安全 性 ”网 络 中 的 计算 机 用 户 各 种 各 样 ， 其 中 有 些 人 会 试图 滥用 甚至 破坏 其 他 人 的 
设备 。 因 为 ， 从 世界 的 任何 地 方 都 可 登录 到 网 络 中 的 某 台 计算 机 上 ， 所 以 需要 身份 认证 、 密 
码 方法 以 及 扫描 输入 信息 (例如 ， 扫 描 病毒 ) 的 安全 技术 。 密 码 方法 (参见 [Tan96, 7.1 
节 ] ) 可 用 于 数据 加 密 以 防 未 经 授权 的 读 操作 ， 也 可 实现 数字 签名 防止 未 经 授权 的 写 操作 。 


1.1.4 局 域 网 


局 域 网 用 于 连接 机 构 内 部 的 计算 机 。 通 常 ， 这 种 连接 的 主要 目的 是 实现 资源 共享 (文件 
以 及 外 围 设备 ) ， 使 得 员工 之 间 的 信息 交换 变 得 容易 。 有 时 ， 网 络 也 用 于 加 速 计算 (将 任务 划 
分 至 其 他 节点 )。 某 些 节点 可 用 作 备 用 节点 ， 以 便 故 障 发 生 时 使 用 。 

1. 例子 和 机 构 

20 世 纪 70 年 代 上 半 叶 ，Xerox 公 司 开 发 出 了 以 太 网 © (Ethernet) 局 域 网 。 广 域 网 的 名 字 ， 
诸如 ARPANET、BITNET 等 都 是 指 特定 的 网 络 ， 而 局 域 网 的 名 字 通 常 是 指 产品 名 。 例 如 ， 只 
有 一 个 ARPANET、 一 个 BITNET、 一 个 UUCP 网 络 和 一 个 Internet， 但 是 每 个 公司 可 能 都 会 建 
立 自 己 的 专用 以 太 网 、 令 牌 环 网 (Token Ring) 或 者 系统 网 络 体系 结构 (system network 
architecture, SNA ). 

与 广域网 络 不 同 ， 以 太 网 采用 类 似 总 线 (bus-like) 的 结构 ， 例 如 ， 节 点 间 通 过 连接 节点 
的 机 制 进行 通信 ; 参见 图 1-2。 尽 管 连接 机 制 和 如 何 使 用 有 所 不 同 ， 类 似 总 线 的 结构 在 局 域 网 
上 非常 普遍 。 

以 太 网 的 设计 一 次 仅 允 许 传输 一 条 消息 ; 其 他 设 
计 ， 例 如 ， 令 牌 网 (token ring, 由 IBM Zürich 实验 室 
开发 ) 允许 空间 重用 (spatial reuse ) ， 即 通过 通信 机 
制 可 以 同时 传输 数 条 消息 。 总 线 结构 要 求 少量 硬件 ， 
因此 其 价格 低廉 ， 但 是 这 种 结构 也 具有 可 扩充 性 
(scalable) 差 的 缺点 。 这 表明 一 条 总 线 所 连接 的 节点 
的 最 大 数量 相当 有 限 。 拥 有 大 量 计算 机 的 大 公司 必须 
用 几 条 总 线 将 它们 连接 起 来 ， 总 线 之 间 用 网 桥 (bridge) 相连 。 这 就 引出 了 一 个 分 层次 的 整体 
网 络 结构 问题 。 

并 不 是 所 有 的 局 域 网 都 采用 总 线 结构 。IBM 设 计 了 一 个 点 对 点 的 网 络 产品 ， 称 为 SNA。 
SNA 可 将 不 同 的 IBM 产 品 相连 。SNA 设 计 复杂 ， 因 为 要 与 IBM 许 多 现 有 网 络 产品 兼容 。 

2. 算法 上 的 问题 | 

对 于 上 面 提 到 的 广域网 中 的 一 些 问 题 ， 局 域 网 的 实现 需要 其 中 一 些 问题 的 解决 方案 。 由 
于 总 线 通 常 可 靠 且 速度 快 ， 因此， 可 靠 的 数据 交换 不 成 问题 。 在 类 似 总 线 结构 的 网 络 中 ， 也 


© Ethernet 是 Xerox 公 司 的 商标 。 












通信 系统 


图 1-2 总 线 连接 的 网 络 
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不 会 有 路 由 问题 ， 这 是 因为 可 以 通过 总 线 直 接 按 地 址 编码 确定 每 条 消息 的 目的 地 。 在 环形 网 
络 中 ， 所 有 消息 沿 着 环 向 同一 方向 发 送 ， 并 且 由 接收 者 或 发 送 者 将 它们 移 去 ， 这 使 路 由 问题 
变 得 无 效 。 在 总 线 中 没有 拥塞 问题 。 因 为 每 条 消息 在 发 送 后 可 以 很 快 地 被 接收 到 (从 总 线 上 
取 走 )。 但 是 限制 在 节点 中 等 待 进 入 总 线 的 消息 数量 却 是 必要 的 。 由 于 消息 不 在 中 间 节 点 存储 ， 
就 不 会 产生 存储 转发 的 死 锁 问题 。 如 果 所 有 计算 机 都 是 由 家 庭 或 信用 其 员工 的 某 个 公司 所 拥 
有 ， 那 么 通常 操作 系统 提供 的 保护 即 可 解决 安全 问题 。 

在 局 域 网 上 ， 运 行 一 个 分 布 式 应 用 程序 (进程 集合 ， 其 分 布 在 网 络 的 节点 上 ) 需要 解决 
以 下 分 布 式 控制 的 问题 ， 有 些 问题 在 第 二 部 分 讨论 。 

(1) 广播 和 同步 (第 6 章 ) ”如 果 所 有 进程 都 必须 得 到 信息 或 者 只 有 当 全 局 条 件 得 到 满足 ， 
所 有 进程 才能 继续 进行 ， 就 需要 一 种 消息 传递 模式 ， 使 消息 到 达 所 有 进程 。 

(2) 选择 (第 7 章 ) ”有些 任 务必 须 由 一 个 集合 中 的 某 一 进程 来 执行 ， 例 如 ， 产 生 输 出 或 
初始 化 数据 结构 。 如 果 有 时 值得 或 有 必要 ， 而 又 没有 一 个 进程 赋予 这 个 任务 优先 级 ， 就 必须 
执行 分 布 式 算法 ， 来 选择 一 个 进程 执行 这 项 任务 。 

(3) 终止 检测 (第 8 章 ) ”在 分 布 式 系统 中 ， 进 程 并 不 总 是 能 够 直接 地 观测 到 它们 进行 的 
分 布 式 计算 是 否 已 经 终止 。 这 就 需要 进行 终止 检测 ， 使 计算 结果 更 确切 。 

(4) 资源 分 配 ”一 个 节点 可 能 访问 网 络 中 某 些 资源 ， 这 些 资源 在 网 络 的 其 他 地 方才 可 用 ， 
尽管 可 能 不 知道 资源 所 处 的 位 置 。 仅 仅 维持 一 张 资源 所 处 位 置 的 列表 是 不 够 的 ， 因 为 潜在 资 
源 的 数量 可 能 会 很 大 ， 而 且 资 源 会 从 一 个 节点 向 另 一 节点 迁移 。 在 这 种 情况 下 ， 请 求 资源 的 
节点 可 能 会 查询 全 部 或 者 部 分 其 他 节点 有 关 资 源 可 用 人 性 的 情况 ， 例 如 ， 使 用 广播 机 制 。 在 第 6 
章 中 描述 了 关于 此 问题 的 算法 所 依据 的 波动 机 制 ， 参 见 文献 Baratz et al. [BGS87]。 

(5) 互 斥 ” 当 进 程 必须 依赖 于 一 次 只 能 被 一 个 进程 使 用 的 公共 资源 时 ， 就 会 引起 互 斥 问 
题 。 这 类 资源 可 以 是 一 人 台 打 印 设备 或 要 被 写 的 文件 。 分 布 式 算 靶 有 必要 决定 : 当 几 个 进程 同 
时 请 求 访问 资源 时 ， 哪 一 个 进程 被 允许 先 使 用 资源 。 同 时 保证 只 有 当前 一 进程 用 完 所 需 资源 
后 ,下 一 进程 才能 开始 使 用 这 一 资源 。 

(6) 死 锁 检 测 和 解决 方法 ”如 果 进程 必须 相互 等 待 ( 当 它 们 共享 资源 并 且 其 计算 要 依赖 
于 其 他 进程 提供 的 数据 时 ) ， 周 期 性 等 待 可 能 发 生 ， 此 时 不 能 进一步 进行 计算 。 因 此 必须 检测 
出 这 些 死 锁 的 情形 ， 并 采取 适当 措施 重新 开始 或 继续 计算 过 程 。 

(7) 分 布 式 文件 维护 当 节 点 对 一 远程 文件 进行 读 写 请 求 时 ， 这 些 请 求 的 处 理 次 序 是 任 
意 的 。 必 须 做 出 规定 来 保证 每 一 节点 对 文件 读 写 次 序 的 一 臻 性。 利用 时 稚 (time stamp) 以 及 
文件 中 的 信息 可 以 做 到 这 一 点 ， 并 根据 时 截 ， 对 不 断 到 来 的 请 求 定 义 一 个 次 序 。 参 见 文献 
[LL86]. 


1.1.5 多 处 理 器 计算 机 


一 台 多 处 理 器 计算 机 是 由 几 个 规模 较 小 的 处 理 器 组 成 的 计算 机 ， 通 常 在 一 个 大 机 盒 内 。 
它 与 局 域 网 的 区 别 在 以 下 几 个 方面 : 它 的 处 理 器 是 同 质 的 ， 即 它们 是 由 相同 的 硬件 构成 的 。 
机 器 所 处 物理 范围 很 小 ， 通 常 在 一 米 左右 。 在 一 个 计算 中 使 用 多 个 处 理 器 (要 么 提高 速度 ， 
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要 么 提高 可 靠 性 )。 如 果 多 处 理 器 计算 机 的 主要 设计 目标 是 提高 计算 机 的 速度 ， 常 称 它 是 并 行 
计算 机 。 如 果 它 的 主要 设计 目标 是 提高 可 靠 性 ， 则 称 它 是 可 复制 的 系统 。 并 行 计算 机 可 以 分 
成 单 指令 、 多 数据 (SIMD) 机 器 和 多 指令 、 多 数据 (MIMD) 机 器 。SIMD 机 器 有 一 个 指令 
解释 器 ， 但 是 指令 是 通过 大 量 算术 单元 来 实现 。 显 然 ， 这 些 单元 缺乏 关于 分 布 式 系统 定义 所 

要 求 的 自主 性 ， 因 此 ， 本 书 将 不 考虑 SIMD 计 算 机 。MIMD 机 由 几 个 独立 的 处 理 器 组 成 ， 它 们 

归 类 为 分 布 式 系统 。 

处 理 器 上 通常 配 有 与 其 他 节点 进行 通信 的 专用 硬件 。 处 理 器 之 间 的 通信 可 以 通过 总 线 或 
者 点 对 点 的 链 路 。 如 果 选 择 总 线 结构 ， 其 结构 只 能 扩展 到 有 限 值 。 

Inmos 开 发 的 Transputer ”芯片 曾经 是 用 于 设计 多 处 理 器 计算 机 的 广 受 欢 迎 的 处 理 器 。 参 
见 图 1-3。Transputer 芯 片 由 中 央 处 理 单元 (CPU ) ， 专 用 浮 点 运算 单元 (FPU ) ， 局 部 存储 器 和 
4 个 专用 通信 处 理 器 组 成 。 这 种 芯片 非常 适 于 构筑 度 为 4 的 网 络 ( 每 一 节点 与 其 他 4 个 节点 相连 ) 。 
Jnmos 还 生产 专用 通信 芯片 ， 被 称 为 路 由 器 。 每 台 路 由 器 能 够 同时 处 理 32 个 Transputer 链 路 的 
通信 量 。 检 查 每 一 到 来 的 消息 ， 确 定 要 转发 的 链 路 ， 然 后 经 由 那 条 链 路 发 送 。 在 90 年 前 半 叶 ， 
这 些 机 器 流行 的 程度 达到 首 峰 。 





图 1-3 TRANSPUTER 和 路 由 芯片 
另 一 个 并 行 计 算 机 的 例子 是 Thinking Machines 公 司 {LAD+92] 开发 的 Connection 
Machine CM-5 © 系统 ， 并 由 Connection Machines Services 公司 继续 开发 。 该 机 器 的 每 一 个 节 
点 由 快速 处 理 器 和 向 量 处 理 单元 组 成 。 除 了 由 许多 节点 提供 并 行 性 之 外 ， 还 提供 内 部 并 行 性 。 
每 一 节点 的 潜在 性 能 可 以 达到 每 秒 1.28 亿 次 操作 ， 一 个 机 器 包含 16 384 个 节点 ， 整 个 机 器 每 秒 
可 执行 10? 次 以 上 的 操作 (由 16 384 个 处 理 器 组 成 的 最 大 机 器 可 占据 900 平 方 米 的 房 闻 ， 也 可 
能 很 昂贵 ) 。CM-5 的 节点 由 三 个 点 对 点 的 通信 网 络 连 接 而 成 。 数 据 网 具有 胖 树 (fat tree) 拓 
扑 结构 ， 用 于 在 处 理 器 间 以 点 对 点 方式 交换 数据 。 控 制 网 络 具 有 二 叉 树 拓 扑 结构 ， 用 于 进行 
专用 操作 ， 如 ， 全 局 同步 和 组 合 输入 。 诊 断 风 络 对 于 编程 人 员 是 不 可 见 的 ， 它 用 于 传播 失效 
组 件 的 信息 。 该 计算 机 支持 SIMD 和 MIMD 两 种 程序 设计 模式 。 
在 并 行 计算 机 中 ， 计 算 被 分 成 若 于 子 计算 ， 每 一 节点 执行 一 个 子 计算 。 在 可 复制 的 系统 
中 ， 每 一 节点 执行 整个 计算 。 计 算 之 后 ， 对 结果 进行 比较 并 找 出 和 改正 错误 。 
多 处 理 器 计算 机 的 构建 ， 需 要 解决 几 个 算法 上 的 问题 ， 有 些 类 似 于 计算 机 网 络 上 发 生 的 


© Transputer 是 Inmos 公 司 的 商标 ， 现 在 属于 SGS-Thomson Microelectronics, 
© Connection Machine 是 一 注册 商标 ，CM-5 是 Thinking Machines 公 司 的 商标 。 
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8 BLS Fibs QPKAK 


问题 。 本 书 讨论 了 几 个 这 样 的 问题 。 

(1) 消息 传递 系统 的 实现 ”如 果 多 处 理 器 计算 机 所 构成 的 是 点 对 点 的 网 络 ， 则 必须 设计 
通信 系统 。 这 里 所 引出 的 问题 类 似 于 计算 网 络 实现 时 所 出 现 的 问题 ， 如 ， 传 输 控 制 ， 死 锁 和 
拥塞 预防 。 这 些 问 题 的 解决 办 法 常常 要 比 一 般 计 算 机 网 络 中 要 简单 一 些 。 例 如 ， 路 由 问题 可 
以 通过 规则 的 网 络 拓扑 结构 (如 环 或 网 格 ) 和 可 靠 的 结 点 来 简化 。 

”Inmos C104 路 由 芯片 利用 非常 简单 的 路 由 算法 ， 称 为 区 间 路 由 (interval routing) 算法 ， 
在 4.4.2 节 中 将 对 此 进行 讨论 ， 这 一 算法 不 能 有 效 地 被 应 用 在 任意 拓扑 结构 的 网 络 中 。 这 就 提 
出 了 一 个 问题 ， 是 否 其 他 一 些 问 题 的 解决 方法 ， 例 如 死 锁 预防 ， 可 与 此 路 由 机 制 结 合 使 用 。 

(2) 虚拟 共享 内 存 的 实现 许多 并 行 算 法 是 为 所 谓 的 并 行 随机 访问 存储 器 (PRAM ) 模型 
设计 的 ， 该 模型 中 的 每 个 处 理 器 可 以 访问 共享 存储 器 。 物 理 上 共享 的 存储 器 的 体系 结构 是 不 
可 扩展 的 。 这 就 严格 限制 了 一 片 存储 器 芯片 上 的 处 理 器 数目 。 

因而 研究 的 方向 应 该 是 具有 多 个 存储 节点 的 体系 结构 ， 存 储 节点 与 处 理 器 通过 互联 网 连接 。 

(3) 负载 平衡 ”只 有 当 计 算 的 负载 被 均匀 分 布 到 各 处 理 器 上 时 ， 才 能 充分 开拓 并 行 计算 
机 的 计算 能 力 。 工 作 的 负载 集中 在 某 个 节点 上 ， 会 降低 节点 的 性 能 。 如 果 在 编译 时 能 确定 计 
算 的 所 有 步 又 ， 就 可 能 静态 地 分 布 计算 负 载 。 更 困难 的 情况 是 在 计算 的 过 程 中 动态 产生 的 任 
务 ; 在 这 种 情况 下 ， 需 要 复杂 的 技术 。 必 须 定 期 地 对 处 理 器 的 任务 队列 进行 比较 ， 之 后 将 任 
务 从 一 个 处 理 器 迁移 到 另 一 个 处 理 器 。 有 关 负 载 平衡 的 某 些 技术 和 算法 参见 文献 
Goscinski[Gos91 ， 第 9 章 ] 或 Harget 和 Johnson[HJ90]。 

(4) 健壮 性 对 不 可 测 故 障 (第 三 部 分 ) 在 一 个 可 复制 的 系统 中 ， 必 须 有 一 种 机 制 来 克服 
一 个 或 多 个 处 理 器 故障 。 当 然 ， 尽 管 网 络 中 某 一 节点 会 发 生 故障 ， 计 算 机 网 络 还 是 要 继续 运 
行 ， 在 这 种 情形 下 ， 通 常 假设 这 种 故障 可 以 被 其 他 节点 检测 出 (参见 4.3 节 的 网 络 变 更 算法 )。 
如 果 假 设 可 复制 的 系统 一 定 是 正确 的 ， 则 会 带 来 更 加 严重 的 后 果 ， 这 是 因为 处 理 器 可 能 产生 
一 个 错误 的 响应 ， 而 按照 协议 就 像 运 行 正确 的 处 理 器 。 必 须 实现 能 对 处 理 器 结果 进行 筛选 的 
选举 机 制 ， 使 得 只 有 大 多 数 处 理 器 运行 正确 ， 才 会 发 送 正 确 的 结果 。 


1.1.6 协同 操作 进程 


通过 将 软件 组 织 成 (顺序 ) 进程 集 可 以 简化 复杂 软件 系统 的 设计 。 其 中 每 一 进程 具有 一 
个 定义 明确 的 简单 任务 。 

描述 这 种 简化 的 经 典 例子 是 Conway 的 记录 转换 (Conway's record conversion )。 问 题 是 读 
入 80 个 字符 的 记录 ,并 在 125 个 字符 的 记录 上 写 下 同样 数据 。 输入 每 条 记录 后 ,插入 一 个 空格 ， 
每 对 星 号 (“**”) 必须 用 一 个 感叹 号 (“1”) 替代 。 每 条 输出 记录 后 必须 紧 跟 一 个 记录 结束 
TF 〈(EOR)。 可 用 程序 实现 这 种 转换 ， 但 是 写 这 个 程序 还 是 很 复杂 的 。 所 有 功能 ， 即 用 “! ” 
亚 代 “**”， 空 格 的 插入 ， 以 及 EOR 字 符 的 插 人 人， 必须 在 一 个 循环 内 完成 。 

这 个 程序 可 以 更 好 地 结构 化 为 两 个 协同 操作 的 进程 。 第 一 个 进程 p, 读 取 输 入 卡 ， 并 把 输入 
转换 成 可 打印 的 字符 流 而 不 是 分 解 成 记录 。 第 二 个 进程 p, 接 收 字 符 流 ， 每 125 个 字符 后 插入 一 
个 EOR。 通 常 假设 将 操作 系统 ， 电 话 交换 中 心 ， 以 及 计算 机 网 络 中 的 通信 软件 设计 成 进程 的 
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集合 。 参 见 1.2.1 节 。 

设计 成 协同 进程 能 够 把 应 用 变 成 逻辑 上 (logically) 是 分 布 式 的 ， 但 也 可 能 在 同一 台 计 算 
机 上 执行 进程 ， 在 这 种 情况 下 ， 它 不 是 物理 上 分 布 式 的 。 对 于 逻辑 上 已 经 分 布 的 系统 ， 做 到 
物理 上 分 布 要 更 容易 些 。 计 算 机 操作 系统 必须 控制 进程 的 并 发 执行 ， 并 且 提 供 进 程 间 通信 和 
同步 的 方法 。 

同一 处 理 器 上 执行 的 进程 可 以 访问 同一 物理 存储 器 ， 因 此 自然 可 以 用 存储 器 进行 通信 。 
一 个 进程 写 人 存储 器 某 一 位 置 ， 另 一 进程 从 此 位 置 读 取 。Dijkstra [Dij68] and Owicki and 
Gries [OG76] 采用 了 这 种 并 发 进程 模型 。 本 文中 考虑 的 问题 包含 以 下 几 方面 。 

(1) 存储 器 操作 的 原子 性 ”通常 假设 读 写 存储 器 的 某 一 字 是 原子 性 的 ， 即 ， 一 个 进程 读 / 
写 完 之 后 ， 另 一 进程 才 可 开始 读 / 写 。 如 果 大 于 一 个 字 的 结构 要 被 更 新 ， 就 要 仔细 地 进行 同步 
操作 ， 以 避免 对 部 分 更 新 的 结构 进行 读 取 。 例 如 ， 可 以 对 结构 实现 互 斥 【Dij68] 来 达到 同步 : 


当 某 一 进程 访问 结构 时 ， 不 允许 其 他 进程 读 / 写 结构 。 利 用 共享 变量 实现 互 斥 是 复杂 的 ， 因 为， 


几 个 进程 可 能 同时 寻找 结构 的 人 口 。 

互 斥 访问 共享 数据 所 强加 的 等 待 条 件 可 能 降低 处 理 器 的 性 能 ， 例 如 ,“ 快 ”的 进程 必须 等 
待 “ 慢 ”的 进程 当前 正在 访问 的 数据 。 近 年 来 ， 人 们 关注 原子 共享 变量 实现 的 无 等 待 性 
(wait-free )， 它 表明 一 个 进程 的 读 / 写 无 需 等 待 其 他 进程 。 读 / 写 操 作 可 能 会 重合， 但 经 过 仔 
细 地 设计 读 / 写 算法 ， 原 子 性 可 以 保持 。 关 于 无 等 待 的 原子 共享 变量 算法 可 参见 Kirousis 与 
Kranakis[KK89] ,或 Attiya 和 Welch[AW98]。 

(2) 生产 者 消费 者 问题 ”两 个 进程 ， 一 个 要 写 人 共享 缓冲 区 ， 另 一 个 要 从 此 缓冲 区 读 出 ， 
二 者 要 协作 ， 以 防止 缓冲 区 满 时 第 一 个 进程 写 人 ， 缓 冲 区 空 时 第 二 个 进程 读 出 的 情况 。 当 解 
决 Conway 转 换 问 题 时 ， 就 会 引出 生产 者 消费 者 问题 : pi 产 生 中 间 字 符 流 ，p, 消 费 它们 。 

(3) 无 用 存储 单元 的 收集 ”利用 动态 数据 结构 进行 应 用 程序 设计 时 ， 可 能 会 产生 一 些 不 
用 的 存储 单元 ， 称 为 无 用 存储 单元 ( garbage)。 以 前 ， 当 存储 系统 用 完 自由 空间 时 ， 必 须 中 
断 应 用 程序 ， 调 用 无 用 单元 收集 程序 (garbage collector)， 找 出 并 回收 那些 不 用 的 存储 单元 。 
Dijkstra et al.[DLM*78] 提 出 了 不 工作 (on-the-fly) 无 用 单元 收集 程序 ， 它 可 作为 单独 的 进程 ， 
与 应 用 程序 并 发 执行 。 | 

由 于 应 用 可 能 修改 存储 区 中 的 指针 结构 ， 而 收集 程序 要 决定 哪 一 单元 是 无 用 的 ， 因 此 需 
要 在 应 用 和 收集 程序 之 间 进 行 复杂 的 合作 。 必 须 仔细 分 析 算法 ， 来 表明 所 作 的 修改 不 会 引起 
有 用 单元 被 错误 回收 。Ben-Ari[BA84] 给 出 了 on-the-fly 无 用 单元 收集 算法 的 更 加 简单 的 正确 性 
证 明 。 

这 里 所 列 出 的 问题 的 解决 方法 表明 ， 可 以 为 通过 共享 存储 器 进行 通信 的 进程 解决 进程 交 
互 的 困难 问题 。 然 而 ， 其 解决 方法 常常 是 非常 复杂 的 ， 有 时 一 个 非常 微妙 的 不 同 进程 的 步 又 
交错 就 会 导致 那些 咋 一 看 似乎 是 正确 的 解决 方法 的 错误 结果 。 因 此 ， 操 作 系统 和 程序 设计 语 
言 为 更 结构 化 的 组 织 进程 间 的 通信 提供 原 语 。 

(1) 信号 量 (Semaphore) 信号 量 [Dij68] 是 一 个 非 负 的 (整数 ) 变量 ， 在 一 次 原子 操 
作 内 其 值 可 被 读 写 。 一 次 V 操 作 使 其 值 增加 1， 当 它 的 值 为 正 时 ， 一 次 P 操 作 使 其 值 减 小 1 (只 
要 其 值 为 0， 则 将 执行 该 进程 挂 起 )。 

者 号 量 是 实现 共享 数据 结构 上 互 斥 的 合适 工具 : 信和 号 量 初始 化 为 !， 在 访问 数据 结构 之 
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前 进行 一 次 P 操 作 ， 之 后 跟着 一 次 V 操 作 。 信 号 量 赋予 每 一 进程 正确 使 用 的 责任 ， 如 果 一 个 
进程 错误 地 操作 了 数据 ， 或 者 没有 执行 所 要 求 的 P 和 V 操 作 ， 则 共享 数据 的 完整 性 就 要 受到 
侵犯 。 

(2) 管 程 (Monitor) ” 管 程 [Hoa74] 由 数据 结构 和 过 程 集 组 成 。 它 以 互 斥 的 方式 调用 
进程 执行 这 些 过 程 。 由 于 数据 仅 能 经 过 管 程 中 声明 的 过 程 进 行 存 取 ， 因 此 只 要 正确 地 声明 管 
程 ， 就 能 正确 使 用 数据 。 管 程 限制 了 对 数据 的 无 限 存 取 ， 并 通过 不 同 进程 来 使 这 些 存 取 同 步 。 

(3) 管道 (Pipe) ”管道 是 一 种 移动 数据 流 的 机 制 ， 它 使 数据 流 从 一 个 进程 移动 到 另 一 个 
进程 。 并 使 两 个 通信 的 进程 同步 。 它 是 生产 者 和 消费 者 问题 的 预 编程 解决 办 法 。 

在 UNIX 操 作 系统 中 ， 管 道 是 最 基本 的 通信 机 制 。 如 果 程 序 p; 实 现 了 Conway 的 问题 转换 进 
程 p!， 程 序 p; 实 现 了 Conway 的 进程 p2:， 那 么 UNIX 命 令 p! | p; 调 用 两 个 程序 ， 并 通过 管道 将 它 
们 连接 起 来 。p; 的 输出 被 放 人 缓冲 区 ， 成 为 p 的 输入 ; 当 缓 冲 区 注 时 ， 持 起 p,， 当 缓冲 区 空 时 ， 
Htp. 

(4) 消息 传递 (Message passing) ” 某 些 程序 设计 语言 ， 如 occam 和 Ada， 为 进程 间 通 信 
提供 了 消息 传递 机 制 。 利 用 消息 传递 解决 同步 问题 相对 要 容易 一 些 ; 因为 消息 在 发 送 之 后 才 
接收 ， 消 息 交 换 导致 了 事件 间 的 临时 关系 。 

利用 管 程 或 者 管道 可 以 实现 消息 传递 。 自 然 地 ， 消 息 传递 是 运行 在 分 布 式 硬件 (无 共 训 
存储 器 ) 上 的 系统 的 通信 工具 。occam 和 Ada 语 言 实际 上 是 考虑 为 具有 物理 上 分 布 的 应 用 程序 
而 开发 的 。 

1.2 体系 结构 和 语言 

实现 计算 机 通信 网 的 软件 是 非常 复杂 的 。 本 节 解 释 该 软件 的 构成 。 它 由 -一些 称 为 时 

(1.2.1 节 ) 的 相关 模块 组 成 。 我 们 讨论 两 种 网 络 体系 结构 标准 ， 即 ， 作 为 广域网 标准 的 开放 系 


Z£ (open systems interconnection, OSI) 模型 和 局 域 网 的 IEEE 补 充 标准 (1.2.2 节 和 1.2.3 
节 )。 同 时 简要 地 讨论 了 分 布 式 系统 所 用 的 程序 设计 语言 (1.2.4 节 )。 


1.2.1 结构 


在 分 布 式 系统 ， 由 通信 子 系统 执行 的 任务 的 复杂 性 ， 要 求 子 系统 的 设计 高 度 结构 化 。 为 
此 ， 将 网 络 划分 成 模块 ， 每 一 模块 执行 确定 的 功能 ， 并 依赖 其 他 模块 所 提供 的 服务 。 在 网 络 
的 组 织 中 ,模块 之 间 ， 有 严格 的 层次 (hierarchy )， 每 一 模块 只 使 用 上 一 层 模块 所 提供 的 服务 。 
在 网 络 实现 中 ， 称 模块 为 层 或 者 级 。 参 见 图 1-4。 


层 之 间 的 接口 





图 1-4 分 层 网 络 体系 结构 
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每 一 层 实 现 网 络 功能 一 部 分 ， 并 依赖 于 它 的 下 一 层 。 在 第 i 层 到 第 i+1 层 的 接口 ( 简 记 ， 
i (i+1) 接 口 ) 中 ,详细 描述 了 第 i 层 到 第 i+1 层 所 提供 的 服务 。 设 计 网络 时 ， 第 一 件 要 做 的 事 
情 就 是 定义 层 数 和 子 层 的 接口 。 

每 一 层 的 功能 由 分 布 式 算法 实现 。 假 设 (六 1 )/i 接 口 已 经 定义 ， 第 ; 层 的 算法 解决 凡 (it1) 
接口 所 定义 的 “问题 ”。 例 如 ，(F1)A 接 口 确定 了 消息 从 节点 p 向 节点 4 传送 ， 但 有 些 消息 可 能 
BR, WAH!) 接口 确定 了 消息 从 节点 p 向 节点 4 可 靠 地 传送 。 第 ;县 的 算法 问题 就 是 利用 不 可 
靠 的 消息 传递 来 实现 可 靠 的 消息 传递 ， 通 过 确认 和 重 发 丢失 消息 就 可 做 到 (参见 1.3.1 节 和 第 3 
章 )。 问 题 的 解决 方法 定义 了 通过 第 i 层 的 进程 所 交换 的 消息 的 类 型 以 及 这 些 消 息 的 含义 ， 如 ， 
进程 是 如 何 对 这 些 消 息 做 出 反应 的 。 第 i 野 进 程 之 间 “谈话 ”所 用 的 规则 和 约定 称 为 i- 层 协议 
(layer-i protocol), 

最 底层 〈 图 1-4 中 第 0 层 ) 总 是 硬件 层 。0/1 接 口 描述 了 一 些 过 程 ， 通 过 这 些 过 程 ， 第 1 层 可 
以 通过 连接 线路 传送 信息 ， 并 且 层 自身 的 定义 确定 了 所 用 导线 的 类 型 ， 以 及 多 少 伏 特 电 压 表 
示 一 个 1 或 多 少 伏特 电压 表示 一 个 0 等 。 重 要 的 一 点 是 在 第 0 层 实现 的 变化 ( 连 线 用 其 他 线 或 者 
TERMAR) 并 不 要 求 0/1 接 口 改变 。 同 样 规 则 对 于 高 一 层 也 适用 : 层 接口 用 干将 一 个 层 的 
实现 与 其 他 层 屏 项 开 ， 并 可 以 对 实现 进行 改变 而 不 影响 其 他 的 妓 。 

通过 网 络 的 体系 结构 〈architecture ) ， 我 们 确定 了 层 的 集合 以 及 所 有 接口 及 协议 的 定义 。 
因为 网 络 可 能 包括 不 同 厂商 所 生产 的 节点 ， 不同 公司 编写 的 软件 ， 所 以 不 同 公司 产品 的 兼容 
性 是 非常 重要 的 。 兼 容 性 的 重要 性 受到 广泛 认可 ， 因 此 已 经 开发 出 标准 的 网 络 体系 结构 。 下 
一 节 ， 讨 论 两 个 标准 ， 因 为 它们 被 具有 影响 力 的 组 织 (国际 标准 化 组 织 ，ISO 以 及 电气 与 电子 
工程 师 协 会 ，IEEE) 采用 。 

TCP/IP 是 因特网 中 所 用 的 协议 集 。TCP/IP 并 不 是 官方 标准 ， 但 它 的 广泛 使 用 使 其 成 为 事 
实 上 上 的 标准 。TCP/IP 协 议 组 是 按 下 节 讨 论 的 OSI 模型 进行 结构 化 的 ， 但 协议 在 局 域 网 和 广域网 
中 都 可 使 用 。 较 高 一 层 包 含 了 电子 邮件 (简单 邮件 传输 协议 ，SMTP)、 文 件 传 输 (文件 传输 
协议 ，FTP) 和 远程 登录 双向 通信 的 协议 (Telnet). 


1.2.2 OSI 参考 模型 


国际 标准 化 组 织 (ISO) 已 经 为 广域网 上 使 用 的 计算 机 网 络 产品 制定 了 标准 。 网 络 体系 结 
构 的 标准 称 为 开放 系统 互 连 (OSI) 参考 模型 ， 本 节 将 对 它 作 简单 描述 。 由 于 这 一 标准 并 不 完 
全 适合 局 域 网 络 ， 下 一 节 讨 论 IEEE 关 于 局 域 网 的 附加 标准 。 

OSI 参考 模型 由 7 层 组 成 ， 即 ， 物 理 层 、 数 据 链 路 层 、 网 络 层 、 传 输 层 、 会 话 层 、 表 示 层 
和 应 用 层 。 该 参考 模型 确定 了 每 层 的 接口 并 为 每 一 层 提供 了 一 到 两 种 标准 协议 (实现 该 县 的 
分 布 式 算法 )。 

1. 物理 层 

物理 层 的 目的 是 在 通信 信道 上 传输 比特 序列 。 正 如 本 层 的 名 称 所 示 ， 通 过 两 个 节点 间 的 
物理 连接 ， 如 ， 电 话 线 、 光 纤 、 卫 星 就 可 达到 目标 。 本 层 的 设计 纯粹 是 电气 工程 师 的 事 。 其 
中 1/2 接 口 确定 了 下 层 调用 物理 层 服 务 的 过 程 。 物 理 层 的 服务 并 不 可 靠 ， 在 传输 过 程 中 ,位 流 
可 能 混在 一 起 。 

2. 数据 链 路 层 

数据 链 路 层 的 作用 是 屏蔽 物理 层 的 不 可 靠 性 ， 即 ， 为 更 高 一 层 提供 可 靠 的 链 路 。 数 据 链 
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路 层 仅 仅 实现 由 物理 链 路 直接 相连 的 节点 人间 可 靠 连接 ， 因 为 它 是 直接 建 在 物理 层 上 的 ( 非 相 
邻 节 点 间 的 通信 在 网 络 层 实现 )。 

为 此 ， 本 层 将 位 流 分 成 国定 长 的 片 ， 称 为 帧 (frame)。 由 帧 的 接收 者 验证 它 的 校 验 和 
(checksum ) ， 并 判定 该 帧 是 否 被 正确 接收 。 校 验 和 是 加 在 每 帧 后 的 元 余人 信息。 通过 从 接收 方 
到 发 送 方 的 反馈 机 制 ， 通 知 发 送 方 所 发 帧 是 否 被 正确 接收 ， 依 靠 确 认 消 息 (acknowledgement 
message) 完成 反馈 。 如 果 发 送 方 接 到 接收 不 正确 或 者 完全 丢失 的 信息 ， 就 会 重 发 该 帧 。 

可 以 将 上 节 中 解释 的 一 般 性 原理 精 化 ， 使 其 适用 于 不 同 的 数据 链 路 协议 。 例 如 ， 可 以 在 
接收 若干 帧 之 后 发 送 确认 消息 (正确 认 ), 或 者 在 丢失 接收 的 若干 帧 之 后 发 送 确认 消息 ( 负 确 
认 )。 在 正确 地 传输 所 有 帧 之 后 ， 正 确 传送 所 有 帧 的 最 终 责任 可 以 落 在 发 送 方 也 可 以 落 在 接收 
方 。 可 以 对 一 帧 或 多 帧 进行 确认 ， 每 帧 可 以 有 序号 或 者 没有 。 

3. 网 络 层 

网 络 层 的 作用 不 仅仅 只 是 为 那些 经 物理 信道 连接 的 节点 提供 通信 手段 。 而 是 为 所 有 节点 
之 间 的 通信 提供 手段 。 该 层 还 要 为 那些 不 相 邻 节点 的 通信 ， 选 择 通过 网 络 的 路 由 ， 并 控制 每 
一 节点 和 信道 的 通信 负载。 

通常 根据 路 由 表 中 的 网 络 拓扑 结构 信息 选择 路 由 ， 每 一 节点 存 有 一 张 路 由 表 。 如 果 网 络 
的 拓扑 结构 发 生变 化 (由 于 节点 或 信道 的 故障 或 恢复 ) ， 网 络 层 包含 更 新 路 由 表 (routing 
table) 的 算法 。 这 样 的 故障 或 恢复 由 数据 链 路 层 检测 。 

尽管 数据 链 路 层 为 网 络 层 提供 了 可 靠 的 服务 ， 但 网 络 层 提供 的 服务 是 不 可 靠 的 。 从 一 个 
节点 向 另 一 节点 发 送 的 消息 (在 这 一 层 称 为 包 ，packet) 可 能 沿 不 同 路 径 传送 ， 从 而 导致 一 条 
消息 赶 上 另 一 条 消息 的 情况 发 生 。 由 于 节点 的 故障 ， 消 息 可 能 会 丢失 (节点 可 能 在 还 持 有 消 
息 的 时 候 ， 停 止 作业 ) ; 由 于 过 量 的 重 传 ， 消 息 甚至 可 能 被 复制 。 该 层 可 能 会 保证 一 个 有 限 
的 包 生 存 期 ; 例如， 存在 常数 c， 满 足 在 c 秒 内 ， 每 一 包 或 者 被 发 送 至 目的 节点 ， 或 者 委 失 。 

4. 传输 层 

传输 层 的 作用 是 屏蔽 网 络 层 所 带 来 的 不 可 靠 性 ， 为 任意 两 节点 之 间 提 供 可 靠 的 端 对 端 
(end-to-end) 通信 。 这 个 问题 类 似 于 数据 链 路 层 中 解决 的 问题 ， 但 由 于 消息 的 多 次 复制 及 消 
息 重 排 使 问题 复杂 化 。 由 于 网 络 层 不 能 保证 包 的 生存 期 限 ， 这 使 得 不 可 能 利用 周期 序列 号 。 
传输 层 中 传输 控制 所 用 的 算法 类 似 于 数据 链 路 层 中 的 算法 : 序列 号 ， 经 确认 的 反馈 和 重 
传 。 

5. 会 话 层 

会 话 层 的 作用 是 为 维持 不 同 节点 的 进程 之 间 的 连接 提供 便利 。 一 条 链 路 可 以 打开 也 可 关 
闭 ， 且 在 链 路 打开 与 关闭 之 间 ， 使 用 话 路 地 址 而 不 是 复制 带 有 每 条 消息 的 远程 进程 地 址 ， 链 
路 可 用 于 进行 数据 交换 。 会 话 层 利用 传输 层 提供 的 可 靠 的 端 到 端 通信 。 

会 话 可 用 于 文件 传输 和 远程 登录 。 如 果 一 个 节点 在 会 话 过 程 中 损毁 ， 会 话 层 能 够 提供 恢 
复 机 制 ; 如 果 在 两 端 不 能 同时 执行 临界 区 操作 ， 会 话 层 还 提供 互 斥 机 制 。 

6. 表示 层 

当 节 点 上 信息 的 表示 互 不 相同 ， 或 者 不 适合 于 传输 时 ， 通 过 表示 层 进 行 数据 转换 。 在 本 
层 的 下 面 ( 即 5/6 接 口 处 )， 数 据 是 可 传输 的 标准 形式 ; 而 在 本 层 之 上 ( 即 6/7 接 口 处 )， 数 据 是 
用 户 或 者 计算 机 确定 的 形式 。 本 层 还 进行 数据 压缩 (compression) 和 解压 缩 ( decompression) , 
以 城 小 交 给 较 低 一 层 的 数据 量 。 本 层 进行 数据 加 审 (encryption) 与 解密 (decryption), RiR 





PIF FH: DHAKA 13 


证 数据 的 安全 性 和 完整 性 ， 防 止 传输 数据 受到 恶意 破坏 。 
7. 应 用 层 
应 用 层 完成 具体 的 用 户 要 求 ， 如 文件 传输 、 电 子 邮件 、 公 告 牌 或 虚拟 终端 。 由 于 可 能 的 
应 用 的 广泛 性 ， 因 而 不 可 能 对 这 一 层 的 所 有 功能 标准 化 ， 但 是 对 这 里 所 列 出 的 应 用 已 经 提出 
了 标准 。 


1.2.3 局 域 网 络 OSI 模 型 : IEEE 标 准 


OSI 参考 模型 的 设计 在 某 种 程度 上 受到 现 有 广域网 络 体系 结构 的 影响 。 由 于 局 域 网 中 可 能 
没有 某 些 层 ， 局 域 网 中 所 用 的 技术 提出 了 不 同 的 软件 需求 。 如 果 网 络 的 组 织 依 赖 于 所 有 节点 
共享 的 总 线 (参见 1.1.4 节 )， 那 么 网 络 层 几乎 是 空 的 ， 因 为 各 对 节点 都 直接 通过 总 线 相连 。 与 
中 等 规模 点 对 点 网 络 相 比 ， 通 过 限制 由 总 线 引入 的 不 确定 性 因素 ， 可 以 简化 传输 层 的 设计 。 
与 此 相 比 ， 由 于 同一 物理 介质 鹤 在 地 可 能 被 大 量 节 点 访问 ， 所 以 数据 链 路 层 更 复杂 。 

为 了 解决 这 些 问 题 ，IEEE 通 过 了 附加 标准 。 这 个 标准 只 覆盖 OSI 层次 的 较 底层 ， 可 用 于 
局 域 网 (更 准确 地 说 ， 用 于 总 线 结构 的 网 络 ， 而 不 是 点 到 点 的 网 络 )。 因 为 没有 一 个 标准 能 够 
适用 于 现在 广 撑 使 用 的 所 有 网 络 ，IEEE 通 过 了 三 个 不 同 的 、 非 兼容 的 标准 ， 即 CSMA/CD， 
令 牌 总 线 和 令 牌 环 。 用 两 层 子 层 替 代数 据 链 路 层 ， 即 介质 访问 榨 制 (medium access control) 
子 层 和 逻 图 链 路 控制 (logical link control) 子 层 。 

1. 物理 层 

IEEE 标 准 中 的 物理 层 的 作用 类 似 于 最 初 ISO 标准 中 的 物理 层 ， 即 传输 位 序列 。 实 际 的 标 
准 定义 《线路 的 类 型 等 ) 大 不 相同 。 这 是 由 于 所 有 通信 是 通过 公共 可 访问 介质 ， 而 不 是 通过 
点 到 点 的 链 路 。 

2. 介质 访问 控制 子 层 

这 一 子 层 的 目的 是 解决 使 用 共享 通信 介质 的 节点 之 间 出 现 的 冲突 问题 。 静 态 方法 是 对 每 
一 节点 允许 访问 介质 的 时 间 区 间 进 行 调度 。 然 而 这 种 方法 浪费 大 量 带 宽 ， 如 果 只 有 几 个 节点 
有 数据 传输 ， 其 他 节点 无 事 可 做 ; 在 调度 这 些 节 点 时 ， 介 质 处 于 空闲 状态 。 

在 令 牌 总 线 和 令 牌 环 中 ， 对 介质 的 访问 是 基于 循环 方式 的 : 节点 循环 地 请 求 一 个 权力 ， 
称 为 令 牌 ， 只 人 允许 持 有 令 牌 的 节点 利用 介质 。 如 果 持 有 令 牌 的 节点 没有 数据 传输 ， 它 就 把 令 
牌 传 给 下 一 节点 ; 在 令 牌 环 中 ， 节 点 得 到 令 牌 的 循环 次 序 取决 于 物理 链 路 的 拓扑 结构 ( 即 ， 
环 )。 在 令 牌 总 线 中 ， 这 个 循环 次 序 动态 地 取决 于 节点 地 址 的 顺序 。 

在 具有 冲突 检测 的 载波 侦 听 多 路 访问 (CSMA/CD) 标准 中 ， 当 节点 观测 到 介质 空闲 时 ， 
它们 就 被 允许 发 送 。 如 果 两 个 或 多 个 节点 (大 约 ) 同时 发 送 消息 ， 就 会 产生 冲突 ， 当 被 检测 
到 时 ， 引 起 各 节点 中 断 其 传输 ， 稍 候 再 发 。 

3. 逻辑 链 路 控制 子 层 

这 一 层 的 作用 相当 于 OSI 模型 中 数据 链 路 层 的 作用 ， 即 控制 两 节点 间 数 据 的 交换 。 本 层 提 
供 差错 控制 和 流 控 制 ， 它 所 使 用 的 技术 类 似 于 OSI 协议 中 使 用 的 技术 ， 即 ， 序 列 号 和 确认 。 

从 较 高 层 来 看 ， 逻 辑 链 路 控制 子 层 就 像 是 OSI 模 型 中 的 网 络 层 。 事 实 上 ， 任 意 一 对 节点 间 
无 需 中 间 节 点 就 可 以 通信 ， 风 辑 链 路 子 层 直 接 可 对 它们 操作 。 在 局 域 网 中 没有 实现 单独 的 网 
络 层 ， 而 是 将 传输 层 直 接地 建 在 逻辑 链 路 控制 子 层 的 上 面 。 
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124 语言 支持 


不 论 是 通信 网 还 是 分 布 式 应 用 ， 它 们 各 软件 层 的 实现 都 需要 将 该 层 或 应 用 所 使 用 的 分 布 
式 算法 通过 一 种 程序 设计 语言 进行 编码 。 实 际 的 编码 主要 受到 语言 的 影响 ， 尤 其 是 受到 它 所 
提供 的 原 语 的 影响 。 因 为 在 本 书 中 ， 我 们 主要 集中 在 算法 方面 ， 并 不 关心 把 它 编码 成 程序 ， 
进程 的 基本 模型 是 基于 进程 的 状态 和 状态 转移 (参见 2.1.2 节 )， 而 不 基于 执行 从 规定 的 集合 中 
获取 的 指令 。 当 然 ， 对 于 我 们 所 提出 的 算法 ， 一 定 要 求 用 形式 化 的 表示 方法 。 书 中 所 用 的 程 
序 设计 语言 表示 参见 附录 A。 

本 节 我 们 对 分 布 式 系统 的 程序 设计 语言 的 结构 进行 描述 。 这 里 仅 对 这 些 结 构 作 简要 描 
述 ; 更 多 的 细节 和 实际 使 用 各 种 结构 的 语言 的 例子 参见 文献 Bal[Bal90]。 分 布 式 应 用 的 程序 设 
计 语 言 必 需 提供 表达 并 行 性 、 进 程 交互 作用 以 及 非 确 定性 的 手段 。 并 行 性 要 求 系统 中 的 各 节 
点 能 够 并 发 地 执行 程序 中 的 它们 各 自 的 那 一 部 分 。 通 过 程序 设计 语言 来 支持 节点 间 的 通信 。 
因为 一 个 节点 有 时 必需 能 够 接收 来 自 不 同 节点 的 信息 或 者 能 够 发 送 /接收 一 条 消息 ， 这 就 对 非 
确定 性 提出 了 和 要求。 

1. 并 行 性 

在 一 个 分 布 式 系 统 中 ， 最 合适 的 并 行 度 取决 于 通信 开销 和 计算 开销 的 比例 。 较 大 的 并 行 
度 可 以 快速 地 执行 ， 但 也 要 求 更 多 通信 。 如 果 通 信 代 价 高 ， 在 计算 速度 方面 所 得 收益 将 会 在 
通信 中 损失 。 

通常 定义 几 个 进程 (process) 来 表示 并 行 性 ， 每 一 进程 是 一 个 顺序 的 实体 ， 具 有 自己 的 
状态 空间 。 语 言 可 以 静态 定义 进程 集 ， 也 可 以 允许 动态 创建 进程 和 终止 进程 。 还 可 以 用 并 行 
语句 表示 并 行 性 。 语 言 中 的 并 行 性 并 不 总 是 显 式 的 。 将 代码 划分 成 并 行进 程 由 复杂 编译 器 来 
进行 。 

2. 通信 

对 于 分 布 式 系统 ， 进 程 间 的 通信 是 固有 的 。 如 果 进 程 不 进行 通信 ， 每 一 进程 独立 于 其 他 
进程 ， 就 可 以 单独 对 它 进行 研究 ， 它 就 不 是 分 布 式 系 统 的 一 部 分 。 进 程 在 计算 过 程 中 ， 如 果 
需要 另 一 进程 产生 的 中 间 结 果 时 ， 就 会 需要 通信 。 同 样 进程 之 间 也 需要 同步 。 这 是 因为 进程 
在 未 得 到 它 所 需 的 结果 时 ， 必 须 被 挂 起 。 消 息 传 递 (message passing) 可 以 完成 通信 和 同步 。 
而 共享 存储 (shared memory) 只 能 进行 通信 。 此 外 还 需 关注 利用 共享 存储 器 进行 通信 的 进程 
的 同步 。 

在 提供 消息 传递 的 语言 中 , “send” 和 “receive” 操 作 是 可 用 的 。 在 一 个 进程 (这 里 称 发 
送 方 进程 ) 执行 发 送 操作 而 另 一 进程 (接收 方 进程 ) 执行 接收 操作 就 会 发 生 通 信 。 发 送 操作 
的 变量 包括 接收 方 的 地 址 和 附加 数据 ， 形 成 了 消息 的 内 容 。 当 执行 完 接 收 语句 时 ， 对 于 接收 
方才 可 用 附加 数据 。 此 即 实现 了 通信 。 只 有 当 发 送 操作 执行 完 之 后 ， 接 收 操作 才能 完成 。 这 
实现 了 同步 。 在 一 些 语言 中 ， 接 收 操作 并 不 是 显 式 的 ， 而 是 ， 当 接 到 消息 时 ， 激 活 一 个 过 程 
或 操作 。 

语言 可 能 提供 同步 (synchronous) 消息 传递 机 制 ， 在 这 种 情况 下 ， 仅 当 接 收 操作 执行 完 
后 ， 发 送 操作 才 可 完成 。 换 名 话说， 在 消息 未 接收 完 之 前 ， 发 送 方 受到 阻塞 。 导 致 发 送 方 和 
接收 方 双 向 同步 。 

消息 也 可 按 点 到 点 发 送 ， 从 发 送 方向 接收 方 ， 或 者 向 其 他 节点 广播 ， 所 有 接收 方 接收 同一 
消息 。 用 组 播 来 表示 将 消息 发 送 到 进程 集 (不 必 是 所 有 进程 )。 远 程 过 程 调 用 (remote 
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procedure call, RPC) 是 稍微 更 结构 化 的 通信 和 原 语 。 为 了 与 进程 通信， 进程 4 调用 出 现在 进程 
b 中 的 过 程 ， 并 在 消息 中 发 送 过 程 的 参量 。 在 另 一 消息 中 返回 过 程 的 结果 之 前 ， 进 程 a 被 挂 起 。 

另 一 种 消息 传递 是 利用 共享 存储 器 (shared memory) 进行 通信 ; 一 个 进程 将 值 写 入 变量 ， 
另 一 进程 读 取 该 值 。 难 以 达到 进程 间 的 同步 ， 因 为 读 取 变量 可 以 在 写 入 变量 之 前 。 利 用 同步 
原 语 ， 如 信号 量 (semaphore) [Dij68] 或 者 管 程 [Hoa78]， 在 共享 变量 环境 中 实现 消息 传递 是 
可 能 的 。 反 之 ， 在 消息 传递 的 环境 中 ， 实 现 一 个 (虚拟 ) 共享 存储 器 也 是 可 能 的 ， 但 是 效率 
很 低 。 

3. 非 确 定性 

在 进程 执行 中 的 许多 地 方 ， 进 程 可 能 以 各 种 不 同方 式 继续 运行 。 接 收 操作 常常 是 非 确定 
性 的 ， 这 是 因为 它 允 许 接收 来 自 不 同 发 送 方 的 消息 。 表 达 非 确定 性 的 另 一 种 方式 是 基于 保护 
命令 (guarded command)。 最 一 般 形 式 的 保护 命令 是 一 张 语 名 列表， 每 一 语句 之 前 有 一 个 布 
MEEK ( 它 的 保护 )。 只 要 语句 的 相应 的 保护 求 值 为 真 ， 进 程 就 能 继续 执行 。 保 护 可 能 包括 
一 个 接收 操作 ， 在 这 种 情况 下 ， 如 果 接 收 到 一 条 消息 ， 其 值 就 为 真 。 


1.3 分 布 式 算 法 


上 节 给 出 了 利用 分 布 式 计算 机 系统 的 原因 ， 并 解释 了 这 些 系 统 的 性 质 ; 其 结果 是 需 对 这 
些 系统 进行 程序 设计 。 分 布 式 系统 的 程序 设计 一 定 基 于 正确 、 灵 活 和 有 效 的 算法 。 本 节 ， 所 ”世相 
讨论 的 分 布 式 算法 的 开发 在 本 质 上 不 同 于 开发 集中 式 算法 所 使 用 的 技术 。 分 布 式 和 集中 式 系 
统 在 许多 方面 有 本 质 的 不 同 ，1.3.1 节 讨论 这 些 不 同 点 ， 并 在 1.3.2 节 给 出 例证 。 分 布 式 算法 研 
究 作 为 独立 的 科学 研究 领域 得 到 了 发 展 ， 参 见 1.3.3 节 。 本 书 旨 在 将 此 研究 领域 介绍 给 读者 。 
本 书 的 目标 以 及 所 选 的 内 容 在 1.4 节 阐明 。 


1.3.1 分 布 式 算法 与 集中 式 算法 


分 布 式 系统 与 集中 式 〈 一 个 处 理 机 ) 计算 机 系统 的 不 同 ， 主 要 表现 在 以 下 三 个 方面 : 

(1) 款 乏 全 局 状态 知识 ”在 集中 式 算 革 中， 基于 对 系统 状态 的 观察 做 出 控制 决策 。 即 使 在 
一 次 单机 操作 过 程 中 ， 通 常 不 能 访问 整个 状态 ， 程 序 可 以 一 个 接 一 个 地 检查 变量 ， 考 虑 所 有 相 
关 的 信息 后 做 出 决策 。 在 检查 及 决策 的 过 程 之 间 ， 不 修改 数据 ， 从 而 保证 了 决策 的 完整 性 。 

分 布 式 系统 中 的 节点 只 可 以 访问 它们 自己 的 状态 ， 不 能 访问 整个 系统 的 全 局 状态 。 因 此 
它 不 可 能 基于 全 局 状态 来 做 控制 决策 。 一 个 节点 可 以 接收 其 他 节点 的 状态 信息 ， 并 以 此 信息 
作为 控制 决策 的 基础 。 与 集中 式 系统 相 比 ， 所 接收 的 陈旧 信息 可 能 导致 信息 失效 。 因 为 在 发 
送信 息 的 过 程 和 基于 此 而 做 决策 的 过 程 之 间 ， 其 他 节点 的 状态 可 能 已 经 改变 。 

市 点 从 来 不 能 直接 地 观察 到 通信 子 系统 ( 即 ， 在 某 时 刻 ， 哪 些 消息 正在 发 送 过 程 中 ) 的 
状态 。 这 个 信息 只 能 通过 比较 节点 所 发 送 和 接收 的 消息 间接 推出 。 

(2) KEDARRA ”构成 集中 式 算法 执行 的 事件 ， 完 全 自然 地 按照 事件 发 生 的 时 间 定 
序 ; 对 于 每 一 对 事件 ,或 一 个 早 于 一 个 ,或 一 个 迟 于 一 个 。 组 成 分 布 式 算法 执行 的 事件 所 导 [T 
致 的 时 序 关系 并 不 是 全 序 的 ， 对 于 某 些 对 事件 ， 可 以 决定 事件 的 先后 ， 但 对 于 其 他 一 些 事件 ， 
则 不 能 确定 时 序 [Lam78]。 

在 集中 式 系统 中 可 以 实现 互 斥 ， 如 果 进 程 p 对 资源 的 访问 在 进程 9 的 访问 之 后 ， 那么 进程 p 
必须 在 进程 9 结束 之 后 才 可 开始 对 资源 的 访问 。 的 确 ， 所 有 这 类 事件 (进程 p 和 5 的 开始 时 间 和 
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结束 时 间 ) 通过 时 序 关 系 完全 可 以 决定 顺序 ; 而 在 分 布 式 系统 中 ， 却 不 能 做 到 这 一 点 。 进 程 p 
和 4 可 能 开始 访问 资源 ， 但 是 它们 开始 的 先后 次 序 不 能 确定 。 

(3) 非 确定 性 ”集中 式 算法 描述 计算 ， 是 明确 地 从 某 一 输入 开始 的 ; 给 定 程序 和 输入 ， 
只 有 一 种 计算 可 能 。 相 反 ， 由 于 系统 各 组 件 在 执行 速度 上 的 差异 ， 分 布 式 系统 的 执行 通常 具 
有 不 确定 性 。 

考虑 一 下 服务 器 进程 可 能 接受 许多 未 知客 户 进程 请 求 时 的 情形 。 在 所 有 请 求 没 有 接收 完 
时 ,服务器 进程 不 能 挂 起 对 请 求 的 处 理 ， 因 为 不 知道 将 会 到 达 多 少 消息 。 因 此 ， 必 须 立 即 处 
理 每 一 请 求 ， 处 理 的 顺序 就 是 请 求 到 达 的 顺序 。 尽 管 可 能 知道 客户 发 送 请 求 的 顺序 ， 但 由 于 
传输 延迟 未 知 ， 请 求 到 达 的 顺序 可 能 与 发 送 顺 序 不 同 。 

缺乏 全 局 状态 、 缺 乏 全 局 时 间 帧 和 非 确定 性 ， 使 分 布 式 算法 的 设计 技术 极为 复杂 因为 这 
三 方面 会 以 几 种 方式 ， 进 行 干扰 。 

时 间 和 状态 的 概念 联系 紧密 ; 在 集中 式 系统 中 ， 可 将 时 间 定 义 为 系统 执行 过 程 中 的 状态 
序列 。 即 使 在 分 布 式 系统 中 ， 可 以 定义 全 局 状态 ， 并 把 执行 看 作 全 局 状态 的 序列 《参见 定义 
2.2)， 这 种 观点 也 具有 局 限 性 ， 因 为 也 可 用 其 他 全 局 状态 序列 描述 系统 的 执行 (定理 2.21 )。 
这 些 可 选 序列 通常 由 不 同 的 全 局 状态 组 成 ; 这 导致 “在 系统 执行 中 ， 假 设 了 这 个 或 那个 状态 ” 
意义 不 明确 。 

如 果 能 从 要 被 执行 的 算法 预测 全 局 状态 ， 可 能 会 弥补 全 局 状态 知识 的 缺乏 。 令 人 遗 乱 的 
是 ， 由 于 分 布 式 系统 固有 的 非 确 定性 ， 这 一 点 不 可 能 做 到 。 


“1.3.2 一 个 例子 : 单 消息 通信 


我 们 用 一 个 例子 ， 来 说 明 由 于 缺乏 全 局 状态 知识 和 全 局 时 间 - 帧 ， 所 引起 的 困难 ， 即 在 文 
献 [Bel76] 中 由 Belsnes 所 讨论 的 在 不 可 靠 的 介质 上 实现 可 靠 的 信息 交换 。 考 虑 由 数据 网 络 连接 
的 两 个 进程 4q 和 b5， 从 一 个 进程 向 另 一 个 进程 传输 消息 。 消 息 发 出 之 后 ， 可 以 在 任意 时 间 内 接 
收 ， 但 是 也 可 能 在 网 络 中 丢失 。 网 络 控制 过 程 (network control procedure, NCP) 的 使 用 增加 
了 通信 的 可 靠 性 ， 通 过 NCP， 进 程 c 和 2 访问 网 络 。 进 程 c 给 NCP A 一 个 信息 单元 m 来 初始 化 通 
信 。NCP 之 间 的 交互 作用 (经 过 数据 网 络 ，DN ) 必须 保证 信息 m 被 发 送 到 进程 5 (通过 NCP B), 
之 后 ，NCP A 通知 进程 a 关于 信息 的 发 送 。 图 1-5 描 述 了 它们 的 通信 结构 。 


初始 化 





数据 网 络 (DN) 


图 1-5 简化 的 网 络 体 系 结构 


即使 进程 < 只 传送 一 个 信息 单元 给 进程 5 ， 由 于 网 络 不 可 靠 性 ，NCP A 与 NCP B 之 间 的 对 
话 由 几 条 消息 组 成 。 它 们 要 维持 这 个 对 话 的 状态 信息 ， 但 由 于 与 每 一 进程 可 能 的 对 话 对 象 数 
量 很 大 ， 因 此 在 消息 交换 完成 之 后 ， 状 态 信息 即 被 抛弃 。 状 态 信息 的 初始 化 称 作 打开 ， 抛 弃 
状态 信息 称 作 关闭 。 可 见 ， 在 关闭 对 话 之 后 ，NCP 又 完全 回 到 打开 之 前 的 状态 ; 这 称 为 关闭 
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如 果 b 通 知 a 接收 到 消息 ， 而 该 单元 实际 上 从 未 发 送 到 b， 则 称 信息 单元 m 是 丢失 的 ， 如 果 
它 被 发 送 两 次 ， 则 称 单元 m 为 可 复制 的 (duplicated)。 可 靠 的 通信 机 制 不 仅 防止 复制 而 且 防 止 
丢失 。 假 设 NCP 可 能 失效 (损毁 ) ， 失 效 后 ， 在 关闭 状态 可 以 重新 启动 (有效 地 丢失 所 有 关于 
当前 打开 对 话 的 信息 )。 

1. 可 靠 的 通信 不 存在 

由 此 看 来 ， 不 管 NCP 设 计 的 如 何 复杂 ， 也 不 可 能 达到 完全 可 靠 的 通信 。 这 一 结论 独立 于 
数据 网 或 者 NCP 的 设计 并 仅仅 取决 于 这 样 一 个 假设 :NCP 可 能 丢失 有 关 一 次 激活 对 话 的 信息 。 

为 了 表明 这 一 点 ,假设 进程 a 进行 通信 和 初始 化 之 后 ，NCP A 与 NCP B 开 始 对 话 ， 在 接 到 来 
ANCP A 的 消息 m 之 后 ， 假 定 NCP B 将 消息 m 发 送 至 5p。 考虑 一 下 这 样 一 种 情况 : NCP BAS, 
并 且 在 NCP A 发 送 消 息 之 后 ， 在 关闭 状态 重新 启动 。 在 这 种 情况 下 ， 当 NCP B 损 毁 时 ，NCP 
A 和 NCP B 都 不 能 断定 是 否 m 已 经 发 送 ; 这 是 因为 NCP A 不 能 观察 到 NCP B 中 的 事件 (缺乏 全 
局 状态 知识 )， 并 且 NCP B 已 经 损毁 ， 在 关闭 状态 重新 启动 。 不 管 NCP 如 何 继续 进行 对 话 ， 还 
是 会 引入 一 个 错误 。 如 果 NCP A 再 次 给 NCP B 发 送 消息 ，NCP B 传 送 这 条 消息 ， 则 消息 复制 
可 能 出 现 。 如 果 a 所 接 到 的 通知 是 没有 进行 传送 的 ， 则 可 能 出 现 消息 丢失 。 

针对 丢失 或 者 复制 消息 的 情形 ， 我 们 对 NCP 的 几 种 可 能 设计 做 一 评价 。 我 们 试图 设计 这 
样 一 种 协议 ， 在 任何 情况 下 ， 它 都 可 以 避免 丢失 。 

2. 一 消息 对 话 

在 最 简单 的 设计 中 ， 初 始 化 之 后 ，NCP A 单独 由 网 络 发 送 不 可 更 改 的 数据 ， 并 通知 a， 然 
后 关闭 。NCP B 总 是 将 所 接收 的 数据 传送 给 5»， 传 送 之 后 即 关闭 。 

当 网 络 不 能 发 送 消 息 时 ， 这 种 协议 就 会 引起 消息 丢失 ,但 是 它 不 可 能 引入 消息 复制 。 

3. 两 消息 对 话 

在 协议 中 增加 一 个 确认 ,就 可 对 消息 进行 有 限 的 保护 以 防 丢 失 。 在 一 个 正常 的 对 话 中 ， 
NCP A 发 送 数 据 消息 < data, m >， 并 等 待 来 自 NCP B 的 确认 消息 < ack >。 当 接 到 这 个 确认 消息 
BY, NCP A 关闭 对 话 。NCP B 一 旦 接收 到 这 一 消息 < data, m >， 就 把 m 传 送 到 b，、 并 用 < ack > 
消息 进行 应 答 ， 然 后 关闭 。 总 之 ， 无 差错 的 对 话 由 三 个 事件 组 成 。 

1) NCP A 发 送 < data,m >。 

2) NCPB 接收 < data, m >, 传送 m, 发送 < ack >, 关闭 。 

3) NCP A 接收 <ack >, 通知 , 关闭。 

如 果 在 某 段 时 间 后 ，NCP A 没有 接 到 确认 应 答 ， 数据 丢失 的 可 能 性 迫使 NCP A 再 次 发 送 
数据 < data, m >。( 由 于 缺乏 全 局 状态 知识 ， 在 接收 < data, m > 和 发 送 < ack > 之 间 ，NCP A 不 
能 观测 到 是 否 < data, m > 已 丢失 、< ack > 已 丢失 或 者 NCP BHS.) 因此 ，NCP A 在 有 限时 
间 内 ， 等 候 接收 确认 消息 ， 如 果 不 能 接收 到 这 一 消息 ， 则 计时 器 断定 时 间 用 完 ， 就 会 产后 超 
时 (timeout) 信息 。 显 而 易 见 ， 这 种 选择 重 传 消息 的 机 制 引 入 了 复制 的 可 能 性 。 即 ， 不 是 原 
数据 消息 的 丢失 ， 而 是 确认 消息 的 丢失 ， 情 形 如 下 : 

1) NCP A 发 送 < data, m>. 

2) NCPB 接收 < data, m >, 传送 m, 发 送 < ack >, 关闭 。 

3) DN < ack > 于 失 。 

4) NCP A 超时 , 发送 < data,m >。 
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5) NCP B 接收 < data, m >, 传送 m, Riž < ack >, 关闭 。 

6) NCPA 接收 < ack >, 通知 , 关闭 。 

确认 不 仅 能 引起 复制 的 可 能 性 ， 而 且 不 能 进行 保护 以 免 丢 失 ， 情 形 如 下 。 进 程 a 提 供 两 个 
信息 单元 m 和 mm 进行 传输 。 

1) NCP A 发 送 < data, m >. 

2) NCPB 接收 < data, mi >, 传送 m, 发 送 < ack >, 关闭 。 

3) NCP A 超时 , 发 送 < data, m >. 

4) NCPB 接收 < data, m >, 传送 m, 发送 < ack >, 关闭 。 

5) NCPA 接收 < ack >, 通知 , 关闭 。 

6) NCPA 发 送 < data, m >. 

7) DN < data, m > FR. 

8) NCPA 接收 < ack > (step 2) , 通知 , 关闭 。 

消息 mm ， 如 前 一 情形 ， 被 复制 。 但 第 一 次 发 送 的 确认 消息 没有 丢失 而 是 较 慢 。 引 起 稍 后 
信息 单元 的 丢失 。 由 于 没有 全 局 时 间 ， 不 能 检测 出 较 慢 的 发 送 。 

如 果 假 设 有 一 个 较 弱 的 全 局 时 间 ， 即 ， 对 于 任何 通过 网 络 发 送 的 消息 的 传输 延迟 存在 上 
限 7。 就 可 更 容易 地 解决 可 靠 的 进程 间 通 信和 问题 。 这 被 认为 是 全 局 (global) 定时 假设 ， 因 为 
它 导 出 了 不 同 节 点 (NCP A 发 送 和 NCP B 接 受 ) 中 事件 之 间 的 时 序 关 系 。 这 个 协议 可 以 防止 
过 早 接收 对 话 消 息 ， 因 为 在 发 送 最 近 消 息 的 27 时 间 后 ， 才 关闭 NCP A 中 的 对 话 。 

4. 三 消息 对 话 

当 一 个 确认 应 答 丢 失 或 者 延迟 ， 两 消息 协议 就 会 丢失 消息 或 者 复制 信息 。 一 种 解决 的 方 
法 是 在 对 话 中 加 入 第 三 个 消息 ， 通 知 NCP B, NCP A 已 经 收 到 确认 。 一 般 对 话 由 下 列 事件 组 
成 。 

1) NCP A 发 送 < data,m >。 

2) NCPB 接收 < data, m >, 传送 m, 发送 < ack >. 

3) NCP A 接收 < ack >, 通知 , 发 送 < close >, 关闭 。 

4) NCPB 接收 < close >, 关闭 。 

由 于 消息 < data, m > 丢失 ， 引 起 NCP A 超 时 ， 在 这 种 情况 下 ，NCP A 重 发 消息 。< ack > 
消息 丢失 也 引起 < data, mm > 消息 重 发 ， 但 这 不 会 导致 复制 ， 因 为 NCP B 存 在 一 个 打开 的 对 话 ， 
并 且 能 够 识别 它 已 经 接收 的 消息 。 

令 人 遗憾 的 是 ， 该 协议 仍然 存在 丢失 和 复制 信息 的 可 能 。 因 为 当 < close > 消息 丢失 ，NCP 
B 也 必须 关闭 ， 如 果 NCP B 没 有 接 到 < close > 消息 ， 它 必须 重 传 < ack > 消息 。 在 NCP B 关 闭 之 
Ja, NCP A 应 答 没有 对 话 (< nocon >)。 重 传 的 < ack > 可 能 会 到 下 一 次 NCP A 的 对 话 中 , 被 

当 作 那 次 对 话 中 的 确认 消息 ， 在 丢失 之 前 ， 引 起 下 一 次 信息 。 情 形 如 下 。 

1) NCPA 发 送 < data, m, >. 

2) NCPB 接收 < data, mi >, 传送 四, 发送 < ack >, 

3) NCP A 接收 < ack >, 通知 ， 发 送 < close >, 关闭 。 

4) DN < close > ££, 

5) NCP A 发 送 < data, m >, 

6) DN < data, m > EX. 
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7) NCPB 重 传 <ask > (第 2 步 )。 

8) NCP A 接收 < ack >, 通知 , 发 送 < close >, 关闭 。 

9) NCPB 接收 < close > 关闭 。 

由 于 一 个 对 话 中 的 消息 干扰 了 另 一 对 话 中 的 消息 ， 因 而 再 次 引出 问题 。 可 以 为 每 个 新 的 
对 话 选 择 一 对 新 的 对 话 识别 号 解决 这 一 问题 ，NCP A, NCP B 各 一 个 。 所 选 的 识别 号 包括 在 
所 有 对 话 的 信息 中 ， 用 于 验证 所 接 到 的 消息 是 否 确实 属于 当前 对 话 。 一 般 的 三 消息 协议 如 下 。 

1) NCP A 发 送 < data,m,x>。 

2) NCPB 接收 < data,m,x>, 传 送 m, 发 送 < ack,x,y>。 

3) NCP A 接收 < ack,x,y>, 通 知 , 发送 < close,x,y>, 关 闭 。 

4) NCP B 接收 < close,x,y>, 关 闭 。 

对 三 消息 协议 修改 排除 了 早先 给 出 的 错误 对 话 , 因为 NCP A 在 第 8 步 中 所 接 到 的 消息 并 不 
被 认为 是 对 第 5 步 所 发 送 的 数据 消息 的 确认 应 答 。 然 而 ， 在 传送 m 之 前 (第 2 步 )，NCP B 并 不 
验证 一 条 消息 < data, m, x > 的 有 效 性 ， 这 很 容易 导致 信息 的 复制 。 如 果 第 1 步 中 所 发 的 消息 被 
延迟 并 重新 发 送 ， 后 到 的 < data, m, x > 消息 将 引起 NCP B 再 次 传送 信息 m。 

当然 ， 如 果 NCP B 在 发 送 数据 之 前 接 到 消息 ， 也 应 该 验证 消息 的 有 效 性 。 可 考虑 对 三 消 
息 对 话 做 修改 、 使 得 NCP B 在 第 4 步 而 不 是 第 2 步 发 送 数据 。 在 NCP B 发 送 之 前 ，NCP A 给 出 
通知 ， 但 由 于 NCP B 已 经 接 到 信息 ， 这 似乎 是 合理 的 。 尽 管 必 须 保证 ，NCP B 现 在 可 以 在 任 
意 情况 下 发 送 数据 。 尤 其 是 ， 当 < close, x, y > 消息 丢失 时 。NCP B 复 制 < ack, x, y > 消息 ， 
NCP A 用 < nocon, x, y > 消息 应 答 ， 这 引起 NCPB 发 送 和 关闭 ， 情 形 如 下 。 

1) NCP A 发 送 < data,m,x>。 

2) NCPB 接收 < data,m,x>, 发 送 <ack,x,y>。 

3) NCP A 接收 < ack,x,y>, 通知 , 发 送 < close, x,y>, 关 闭 。 

4) DN < close, x, y> FX, 

5) NCPB 超时 ， 重 发 < ack, x, y>。 

6) NCP A 接收 < ack,x,y>, 应 答 < nocon, x, y >. 

7) NCPB 接收 <nocon, x, y >, 发送 m， 关 闭 。 

由 此 ， 为 了 避免 信息 丢失 、 即 使 NCP A 不 能 确认 与 -和 y 有 连接 ，NCP B 也 必须 发 送 数据 。 
这 就 致使 有 效 性 机 制 对 于 NCP B 是 无 效 的， 导致 复制 信息 的 可 能 性 。 

1) NCP A 发 送 < data,m,x>。 

2) NCP A 超时 , 重 发 数据 < data, m, x>. 

3) NCPB 接收 < data,m,x> (第 2 步 中 发 送 ) ,发 送 < ack, x, y, >. 

4) NCP A 接收 < ack, x, y>, 通知 , 发 送 < close, x, y>, 关闭 。 

5) NCPB 接收 < close, x, y>, 发 送 mm, 关闭 。 
6) NCPB 接收 < data, m, x> (第 1 步 中 发 送 ) ,发 送 < ack, x, y>. 
7) NCP A 接收 < ack x, y, >, 应答 <nocon, x, yz>。 
8) NCPB 接收 < nocon, x, y> 应 答 < ack, x, y>, 发 送 m， 关闭 。 
5. 四 消息 对 话 
如 果 在 发 送 数据 之 前 ，NCP 之 间 认 同 其 对 话 识别 号 ， 就 可 以 避免 以 前 对 话 的 信息 传送 。 
1) NCP A 发 送 < data,m,x>。 
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2) NCP B 接收 < data, m, x>, 发送 < open, x, y >. 

3) NCP A 接收 < open, x, y >, 发 送 < agree, x, y >. 

4) NCPB 接收 <agree, x, y >, fFikm, 发 送 < ack, x, y >, 关闭 。 

5) NCP A 接收 < ack, x, y >, 通知 , 关闭 。 

NCP B 损 毁 的 可 能 性 迫使 差错 处 理 满 足 ， 即 使 实际 上 NCP 没有 损毁 时 ， 复 制 仍然 会 出 现 。 
当 NCP B 接 收 到 消息 < agree, x, y > 并 且 没 有 对 话 打开 时 ， 它 就 发 送 错误 消息 < nocon, x, y >. 
假设 NCP A 没有 接 到 消息 < ack, x,y >， 即 使 重 传 几 次 < agree, x, y > 之 后 ， 也 只 能 接 到 
< nocon, x,y > 消息 。 因 为 在 接收 到 < agree, x, y > 以 前 ，NCP B 已 经 损毁 ， 这 迫使 NCP A 打开 
一 个 新 的 对 话 (通过 发 送 < data, m, x >) 以 防止 m 丢 失 ! 但 是 NCP B 可 能 已 经 传送 m， 并 且 消 
息 < ack, x,y> 已 经 丢失 ， 在 这 种 情况 下 ， 会 引发 复制 。 

可 以 用 这 样 一 种 方法 修改 协议 ， 这 就 是 一 旦 接收 到 消息 < nocon, x, y >, NCP A 即 通知 并 
关闭 ; 这 可 以 防止 复制 ， 但 可 能 引起 消息 丢失 ， 这 是 不 可 取 的 。 

6. 五 消息 对 话 和 比较 

Belsnes[Be176] 在 文献 中 给 出 了 一 种 五 消息 协议 ,不 丢失 信息 而 且 只 有 在 NCP 实 际 损毁 时 
才 进 行 复制 。 因 此 ， 根 据 观察 ， 既 然 不 可 能 有 可 靠 的 通信 ， 这 可 能 是 最 好 的 协议 。 由 于 开销 
过 大 (传输 一 个 信息 单元 ，NCP 要 交换 五 次 消息 )， 是 否 五 消息 协议 一 定 比 简单 的 两 消息 协议 
更 可 取 ， 这 是 令 人 怀疑 的 。 事 实 上 ， 因 为 即使 五 消息 协议 也 可 能 引入 复制 ( 当 NCP 损 毁 时 ) ， 
进程 级 必须 处 理 这 种 情形 。 两 消息 协议 ， 可 能 带 来 复制 ， 但 如 果 在 协议 中 加 入 对 话 识别 (就 
像 在 三 消息 协议 中 所 做 的 那样 ) 就 可 避免 消息 丢失 ， 因 此 也 可 以 被 采用 。 


1.3.3 研究 领域 


在 过 去 20 年 里 ， 对 于 分 布 式 算法 的 研究 一 直 都 在 继续 着 ， 尤 其 是 在 20 世 纪 80 年 代 ， 取 得 
了 相当 大 的 进步 这 一 领域 逐渐 走向 成 熟 。 在 已 讨论 各 节 中 ， 我 们 指出 的 某 些 技 术 上 的 进展 激 
励 着 分 布 式 算法 的 研究 ， 即 计算 机 网 络 (广域网 和 局 域 网 ) 和 多 处 理 器 计算 机 的 设计 。 最 初 
的 研究 目标 着 眼 于 算法 在 广域网 中 的 应 用 ， 但 是 如 今 该 领域 已 经 开发 出 了 精确 数学 模型 ， 允 
许 将 研究 结果 和 方法 应 用 到 更 加 宽广 的 分 布 式 环境 。 然 而 ， 该 项 研究 与 通信 技术 中 的 工程 发 
展 保持 着 紧密 的 联系 ， 这 是 因为 算法 的 结果 常常 对 网 络 模型 的 变化 非常 敏感 。 例 如 ， 廉 价 的 
微 处 理 器 使 得 构造 由 大 量 相同 处 理 器 组 成 的 系统 成 为 可 能 ， 并 促进 了 “匿名 网 络 ”的 研究 
(参见 第 9 章 ) 。 

有 几 种 期 刊 和 每 年 一 度 的 会 议 专门 关注 分 布 式 算 靶 及 分 布 式 计算 的 研究 和 进展 。 还 有 一 
些 刊物 和 会 议 虽然 不 是 专攻 该 领域 ， 但 也 包含 许多 该 领域 的 出 版 物 。 自 1982 年 以 来 ， 每 年 在 
北美 都 组 织 分 布 式 计算 原理 (Principles of Distributed Computing, PoDC) 的 年 度 会 议 ， 它 
9 会 议论 文 由 美国 计算 机 学 会 出 版 。 国 际 分 布 式 算法 专题 (International Workshops on 
Distributed Algorithms, WDAG) 曾 于 1985、1987、1989 年 分 别 在 Ottawa， Amsterdam 和 Nice 
举行 。 自 那 时 起 ， 每 年 Springer-Verlag 都 将 这 些 会 议论 文 以 计算 机 报告 (Lecture Notes on 
Computer Science) 的 丛书 形式 出 版 。1998 年 ， 该 会 议 的 名 字 改 为 分 布 式 计 算 (Distributed 
Computing，DISC )。 每 年 在 计算 理论 专题 (Symposia on Theory of Computing，SToC) 和 计 
工 机 科学 基础 (Foundations of Computer Science, FoCS) 的 专题 报告 覆盖 了 计算 机 领域 的 所 
有 主题 ， 常 常 有 分 布 式 计算 方面 的 论文 。SToC 会 议 的 论文 集 由 计算 机 学 会 出 版 ， FoCS 会 议 的 
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论文 集 由 IEEE 出 版 。 并 行 和 分 布 式 计算 (Journal of Parallel and Distributed Computing, 
JPDC) 和 分 布 式 计算 (Distributed Computing) 期 刊 定期 发 表 分 布 式 算法 方面 的 论文 。 信 息 
处 理 快报 《Information Processing Letters, IPL) 也 定期 出 版 分 布 式 算法 方面 的 论文 。 


1.4 本 书 概要 


本 书 以 下 列 三 个 目标 为 宗旨 。 

(1) 使 读者 熟悉 研究 给 定 分 布 式 算法 性 质 所 用 的 技术 、 分 析 和 解决 分 布 式 系统 中 出 现 的 
问题 以 及 评价 某 一 网 络 模型 的 价值 所 用 的 技术 。 

(2) 提供 对 儿 种 系统 模型 的 固有 可 能 性 和 不 可 能 性 的 洞察 力 。 在 3.2 节 、 第 12 章 和 第 15 章 
研究 了 全 局 时 间 帧 可 用 性 的 效果 。 第 9 章 研究 了 进程 标识 知识 的 影响 。 第 8 章 讨 论 了 进程 终止 
条 件 的 影响 。 第 三 部 分 研究 了 进程 故障 的 影响 。 

(3) 给 出 了 最 新 分 布 式 算法 的 研究 进展 ， 算 法 的 复杂 度 证 明和 分 析 。 


在 不 能 详尽 讨论 某 一 主题 时 ， 可 参见 给 定 的 相关 科学 文献 。 本 书 所 收集 资料 分 为 三 部 分 : 


协议 ， 基 本 算法 和 容错 。 

1. 第 一 部 分 : 协议 

这 部 分 讨论 计算 机 通信 网 实现 中 所 用 的 通信 协议 ， 引 入 后 一 部 分 所 需 的 技术 。 

第 2 章 引 入 了 以 后 大 部 分 章节 中 所 用 的 模型 。 模 型 既 有 一 般 性 又 有 严密 性 ， 即 ， 不 但 适合 
于 算法 的 设计 和 验证 ， 而 且 也 可 用 于 证 明 不 可 能 性 的 结果 。 它 基于 转移 系统 的 表示 ， 对 于 这 
些 模型 ， 能 容易 地 给 出 安全 性 和 活动 性 的 证 明 规则 。 此 外 ， 还 引入 了 将 因果 关系 表示 成 -一 个 
计算 中 事件 的 偏 序 的 方法 ， 并 且 定义 了 逻辑 时 钟 。 

第 3 章 讨论 了 两 个 节点 间 消 息 转 移 的 问题 。 首 先 提 出 了 单 链 上 包 交 换 协议 组 ， 并 给 出 了 正 
确 性 证 明 ( 源 于 Schoone)。 同 时 ， 论 述 了 Fletcher 和 Watson 提出 的 协议 ， 其 正确 性 依赖 于 正确 
地 使 用 计时 器 。 这 一 协议 的 论述 方法 表明 ， 验 证 方法 是 如 何 应 用 到 基于 定时 器 的 协议 中 。 

第 4 章 讨论 了 计算 机 网 络 中 的 路 由 问题 。 首 先 给 出 关于 路 由 的 一 般 性 理论 和 由 Toueg 提 出 
的 有 关 路 由 表 计 算 的 一 种 算法 。 其 次 ， 论述 了 Tajibnapis 提 出 的 变更 算法 (Netchange 
algorithm )， 给 出 了 Lamport 提 出 的 该 算法 的 正确 性 证 明 。 本 章 以 压缩 路 由 算法 结束 ， 其 中 包 
括 区 间 路 由 算法 和 前 缀 路 由 算法 。 这些 算法 统称 为 压缩 路 由 算法 (compact routing algorithm), 
因为 它们 在 网 络 的 每 一 节点 只 需 少 量 的 存储 空间 。 . 

第 5 章 讨 论 了 包 交换 的 计算 机 网 络 中 避免 存储 转发 死 锁 的 一 些 策略 ， 作 为 关于 计算 机 网 络 
协议 讨论 的 结束 。 利 用 网 络 中 节点 的 缓冲 区 ， 基 于 定义 一 些 无 回路 的 有 向 图 来 设计 这 些 策略 。 
可 以 看 到 ， 如 何在 各 节点 仅 用 适量 的 缓冲 区 来 构造 这 样 的 一 个 图 . 

2. 第 二 部 分 : 基本 算法 

这 部 分 提出 了 许多 算法 上 的 “积木 块 "， 它 们 可 用 作 分 布 式 应 用 中 的 过 程 。 同 时 对 不 同 网 
络 的 计算 能 力 进 行 了 理论 研究 。 

第 6 章 定义 了 “波动 算法 ”的 表示 方法 。 这 是 访问 网 络 中 所 有 节点 的 一 种 模式 。 波动 算法 
可 用 于 通过 网 络 发 布 信息 、 使 节点 同步 或 者 计算 一 个 函数 ， 这 个 函数 依赖 于 分 布 在 所 有 节点 
上 的 信息 。 正 如 将 在 后 续 章节 讨论 的 那样 ， 许 多 分 布 式 控制 问题 可 用 非常 一 般 的 算法 模式 求 
解 ， 其 中 波动 算法 就 是 其 中 的 一 种 。 此 外 ， 本 章 定 义 了 分 布 式 算法 的 时 间 复 杂 度 ， 并 研究 了 
许多 分 布 式 深度 优先 搜索 算法 的 时 间 和 消息 复杂 度 。 
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分 布 式 系 统 中 的 根本 问题 是 选举 问题 : 即 选举 在 以 后 计算 中 起 着 重要 作用 的 某 个 进程 。 第 
7 章 研究 这 个 问题 。 在 环 网 中 首次 研究 了 该 问题 ， 环 网 中 该 问题 的 消息 复杂 度 为 《在 NN 个 处 理 
器 的 环 上 B(N log NM) 个 消息 )。 一 般 的 网 络 中 也 研究 该 问题 并 给 出 一 些 构 造 方法 ， 通 过 这 些 构 
造 可 以 由 波动 和 遍历 算法 得 到 选举 算法 。 本 章 还 讨论 了 Gallager 等 人 提出 的 生成 树 构造 方法 。 

分 布 式 系统 中 的 第 二 个 根本 问题 是 终止 检测 (termination detection) 问题 : 辨别 一 个 分 
布 式 计算 是 否 已 经 完成 (由 进程 自己 完成 )。 第 8 章 中 讨论 这 个 问题 ， 并 证 明了 解决 该 问题 复 
杂 度 的 一 个 下 界 ， 且 详尽 讨论 了 其 他 几 种 算法 。 本 章 还 包括 一 些 经 典 算法 (如 ，Dijkstra、 
Feijen 和 Van Gasteren 提 出 的 算法 ，Dijkstra 和 Scholten 提 出 的 算法 )。 并 再 次 给 出 了 由 波动 算法 
构造 该 问题 的 算法 。 

第 9 章 研 究 了 系统 的 计算 能 力 ， 这 类 系统 不 能 由 惟一 标识 辨别 进程 。Angluin 表 明 ， 在 这 
种 情况 下 ， 许 多 计算 不 能 由 确定 性 算法 实现 。 本 章 还 引入 了 概率 算法 ， 并 且 研 究 这 类 算法 可 
解决 哪些 问题 。 

第 10 章 解释 了 系统 中 的 进程 是 如 何 计 算 一 个 全 局 “图 片 ”的 ， 即 系统 状态 的 一 个 快照 。 
这 样 的 一 个 快照 可 用 于 决定 计算 的 性 质 ， 例 如 ， 是 否 发 生 了 死 锁 、 或 计算 进行 到 什么 程度 。 
在 出 现 错误 时 ， 快 照 还 用 于 重新 启动 一 个 计算 。 

第 11 章 研究 了 网 络 中 方向 性 知识 的 可 用 性 ， 并 给 出 了 计算 这 种 知识 的 几 种 算法 。 

第 12 章 研究 了 爹 局 时 间 概 念 。 定 义 了 几 种 程度 的 同步 。 通 过 相当 详细 的 算法 ， 完 全 异步 
的 系统 可 以 模拟 完全 同步 的 系统 。 可 见 ， 关 于 同步 的 假设 并 不 影响 分 布 式 系统 可 计算 的 功能 
的 集合 。 但 是 ， 它 对 许多 问题 的 通信 复杂 度 有 影响 。 网 络 的 同步 机 制 越 好 ， 问 题 的 算法 复杂 
度 越 低 。 

3. 第 三 部 分 : 容错 

在 实际 的 分 布 式 系统 中 ， 不 能 忽视 系统 中 某 一 部 分 出 现 故 障 的 可 能 性 。 因 此 ， 如 果 某 一 
部 分 失效 ， 研 究 算法 的 行为 就 非常 重要 。 在 本 书 的 最 后 一 部 分 将 讨论 该 问题 ; 第 13 章 简要 介 
绍 了 该 主题 。 

第 14 章 研究 了 异步 系统 的 容错 。Ficher 等 人 给 出 了 一 种 结果 ; 表明 确定 性 的 异步 算法 不 能 
处 理 甚 至 是 非常 适度 类 型 的 故障 ， 单 个 进程 的 损毁 。 本 章 将 要 表明 可 以 处 理 较 弱 类 型 的 错误 ， 
并 且 尽 管 损 毁 故 障 发 生 ， 有 些 问题 还 是 可 以 解决 的 。 相 反 ，Bracha 和 Toueg 的 算法 表明 ， 随 机 
异步 系统 能 够 处 理 大量 的 故障 。 在 这 种 情况 下 ， 较 之 确定 性 算法 ， 随 机 算法 能 为 可 靠 系 统 
(参见 第 9 章 ) 提供 更 多 的 可 能 性 。 

第 15 章 研究 了 同步 算法 的 容错 问题 。Lamport 等 提出 的 算法 表明 ， 确 定 的 同步 算法 可 以 容 
多 重大 故障 。 显 而 易 见 ， 与 可 靠 系统 (第 12 章 ) 遇 到 的 情况 不 同 ， 同 步 系 统 比 异步 系统 提供 
了 更 多 容错 的 可 能 性 。 如 果 进 程 能够 “签署 ”与 其 他 进程 的 通信 ， 就 能 容忍 更 大 量 的 故障 。 
因此 ， 在 不 可 靠 的 系统 中 实现 同步 比 在 可 靠 系统 中 实现 同步 要 更 加 复杂 。 第 15 章 最 后 一 节 将 
专门 进行 该 问题 的 研究 。 

第 16 章 研究 了 抽象 机 制 的 性 质 ， 称 为 故障 检测 器 (failure detector)。 通 过 该 检测 器 ， 进 
程 可 以 获得 对 损毁 及 正确 进程 的 一 个 估计 。 我 们 将 描述 这 种 机 制 的 实现 ， 以 及 如 何 利用 它们 
在 错 环境 中 实现 规范 。 

关于 可 靠 性 的 另 一 种 方法 ， 即 自 稳定 算法 ， 在 17 章 中 讨论 。 称 一 个 算法 是 稳定 的 ， 如 果 
不 管 它 的 初始 配置 ， 它 最 终 都 收敛 到 想 要 的 行为 状态 。 我 们 将 研究 稳定 算法 的 一 些 理论 ， 并 
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提出 大 量 的 稳定 算法 。 这 些 算法 包括 若干 图 论 算法 例如， 深度 优先 搜索 树 的 计算 (参见 6.4 
i), 路 由 表 的 计算 (参见 第 4 章 )。 同 时 ,提出 了 数据 传输 的 稳定 算法 (ALE), KRH, 
稳定 算法 可 以 实现 整个 计算 机 网 络 。 

4. 附录 

附录 A 解释 了 本 书 中 用 于 表示 分 布 式 算法 的 一 些 符 号 。 附 录 B 给 出 了 图 论 及 其 术语 的 一 些 
背景 。 以 参考 文献 和 索引 结束 本 书 。 





第 2 草 模 型 


在 分 布 式 算法 研究 中 ,通常 要 用 几 种 不 同 的 分 布 式 信息 处 理 模型 。 选 择 哪 一 种 模型 取决 
于 问题 所 属 的 分 布 式 计算 领域 以 及 算法 的 类 型 ， 否 则 会 给 出 不 可 能 性 的 证 明 。 在 本 书 中 ， 尽 
管 包 括 了 广泛 的 分 布 式 算法 及 其 理论 ,但 是 本 章 我 们 尽 可 能 尝试 描述 一 种 通用 模型 。 

为 了 容许 不 可 能 性 ( 某 些 任务 的 算法 不 存在 性 证 明 ) 的 结果 ， 模 型 必须 精确 。 一 种 不 可 
能 性 的 结果 是 阐述 系统 中 所 有 可 能 的 算法 。 因 此 ， 模 型 必须 足够 精确 ， 能 够 描述 所 有 确认 无 
疑 的 算法 的 相关 性 质 。 然 而 ， 计 算 模型 要 比 描述 某 一 特定 的 计算 机 系统 或 者 程序 设计 语言 
更 详尽 。 有 许多 不 同 的 计算 系统 ， 我 们 期 望 模型 可 以 应 用 到 一 类 相关 系统 ， 这 类 系统 具有 分 
布 式 系统 的 本 质 特性 。 最 后 ， 模 型 必须 合理 而 简洁 。 因 为 在 证 明 中 ， 必 须 考 虑 模型 的 所 有 方 
面 。 总 之 ， 模 型 既 要 精确 又 要 简明 ， 能 够 兼顾 到 一 类 计算 系统 的 各 个 方面 。 

分 布 式 计算 通常 被 认为 是 离散 事件 的 集合 ， 每 一 事件 在 配置 (整个 系统 的 状态 ) 中 是 一 
原子 变量 。 在 2.1 闻 的 转移 系统 (transition system) 的 定义 中 利用 了 这 种 概念 ， 并 导致 了 可 达 
性 配置 的 概念 和 对 由 算法 引起 的 执行 集合 的 定义 。 如 果 每 次 转移 只 受到 配置 的 部 分 (part) 影 
响 ， 或 转移 只 对 配置 产生 部 分 影响 ， 这 就 使 系统 成 为 “分 布 式 ”系统 。 部 分 主要 是 指 某 个 进 
程 的 (局 部 ) 状态 (或 者 交互 进程 子 集 的 局 部 状态 ) 。 

2.2 节 及 2.3 节 讨论 了 2.1 节 所 描述 的 模型 的 性 质 和 结果 。2.2 节 论述 了 给 定 的 分 布 式 算法 所 
期 望 的 性 质 的 证 明 问题 。2.3 节 讨论 了 一 种 非常 重要 的 表示 法 ， 即 ， 一 次 执行 中 ， 事 件 之 间 的 
因 采 关系 。 这 种 关系 引出 对 执行 上 的 等 价 关 系 的 定义 ; 计算 是 此 关系 下 的 一 个 等 价 类 。 定 义 
了 时 钟 ， 所 提出 的 逻辑 时 钟 作为 本 书 讨论 的 第 一 个 分 布 式 算法 。2.4 节 讨论 了 基本 模型 中 没有 
的 假设 和 表示 法 。 


2.1 转移 系统 和 算法 


状态 按照 离散 步骤 (转移 或 事件 ) 变化 的 系统 ， 通 常 可 以 用 转移 系统 的 概念 描述 。 在 分 
布 式 算法 研究 中 ， 总 体 上 可 将 转移 系统 用 于 分 布 式 系 统 ， 也 可 用 于 算法 中 协同 工作 的 进程 之 
间 。 因 此 ， 对 于 研究 分 布 式 算法 ， 转 移 系 统 是 一 个 重要 的 概念 ， 在 2.1.1 节 中 定义 。 

在 分 布 式 系统 中 ， 转 移 只 影响 到 配置 (系统 的 全 局 状态 ) 的 一 部 分 。 每 一 配置 自身 是 一 
个 元 组 ， 每 一 转移 只 涉及 到 元 组 中 的 一 部 分 。 配 置 的 分 量 包 括 每 一 进程 的 状态 。 对 于 配置 的 
精确 描述 ， 不 同 的 分 布 式 系统 描述 不 同 ， 取 决 于 进程 之 间 的 通信 模式 。 

分 布 式 系 统 中 的 进程 通信 ， 既 可 通过 访问 共享 变量 (shared variable )， 又 可 通过 消息 传递 
(message passing) 来 进行 。 我 们 将 采取 更 加 严格 的 方式 ， 只 考虑 进程 通过 信息 交换 进行 通信 
的 分 布 式 系统 。 第 17 章 讨论 进程 通过 共享 变量 进行 通信 的 分 布 式 系统 。 对 用 共享 变量 进行 通 
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信 感 兴趣 的 读者 ， 可 参阅 Dijkstra 的 标志 性 论文 [Dij68]， 或 者 [OG76] Owicki 和 Gries 论 文 ; 最 
近 的 论述 参见 Attiya 和 Welch [AW98]。 

分 布 式 系统 中 的 消息 可 以 通过 同步 (synchronously ) RH (asynchronously) 的 方式 
传递 。 本 书 着 重 强调 异步 消息 传递 的 分 布 式 系 统 算法 。 为 此 ， 可 将 同步 消息 传递 看 作 是 异步 
消息 传递 的 特例 。 正 如 Charron-Bost 等 人 [CBMT96] 表 明 的 那样 。2.1.2 节 精确 地 描述 了 异步 消 
息 传递 模型 ，2.1.3 节 中 将 此 模型 改造 成 适合 于 采用 同步 消息 传递 的 系统 。 


2.1.1 转移 系统 


转移 系统 由 系统 中 所 有 可 能 的 状态 集 组 成 ， 系 统 可 以 从 这 个 状态 集 以 及 允许 系统 开始 的 
状态 子 集 转移 (“移动 ”")。 为 避免 进程 的 状态 和 整个 算法 的 状态 (“全 局 状态 ”) 相 混淆 ， 从 现 
在 开始 ， 我 们 称 后 者 为 配置 (configuration ) 。 

定义 2.1 转移 系统 是 一 个 三 元 组 (triple) S= (C, 一 , 1)， 其 中 C 是 配置 集 (set of 
configurations )， 一 是 C 上 的 二 元 转移 关系 (binary transition relation)，/ 是 初始 配置 (initial 
configuration) C 的 一 个 子 集 (subset)。 

转移 关系 是 C x C 的 一 个 子 集 。 用 更 便利 的 表示 法 : y~6， 而 不 用 (y, ô) EE 一 表示 

定义 2.2 设 S= (C, 一 ,1) 是 转移 系统 。3 的 一 次 执行 是 一 个 最 大 序列 (maximal sequence) 

= (Yo % Yt), HP, WEL, 并 且 对 所 有 i>0，y; > Yio 

终止 配置 表示 一 个 配置 "， 在 这 个 配置 中 ， 不 存在 6 满足 条 件 : y- 5. HER, METH, AA 
Xi 一 Yn 的 序列 E = 《hp，X1，%，…)， 如 果 它 是 无 限 的， 或 者 以 终止 配置 结束 ， 则 它 是 最 大 的 。 

定义 2.3 如果 对 所 有 0 <i< kk， 存在 序列 y= p, Ys Y o n= 6 且 yi 一 Yn， 则 称 配置 6 是 
由 ?可 达 的 (ITeachable)， 记 为 7y~>53。 如 果 配 置 6 从 初始 配置 是 可 达 的 ， 则 称 它 是 可 达 的 。 


2.1.2 异步 消息 传递 系统 


分 布 式 系统 由 进程 集 和 通信 子 系统 组 成 。 每 一 进程 自身 是 一 转移 系统 ， 且 它 能 与 通信 子 
系统 进行 交互 。 为 避免 整个 分 布 式 系统 的 属性 和 单个 进程 的 属性 混淆 ， 我 们 使 用 下 列 约定 。 
术语 “转移 ”和 “配置 ”用 于 表示 整个 系统 中 的 属性 。 术 语 “ 事 件 ” 和 “状态 ”用 于 表示 进 
程 的 属性 。 为 了 与 通信 系统 交互 ， 进 程 不 仅 有 普通 事件 ( 称 为 内 部 享 件 )， 而 且 有 发 送 事件 和 
接收 享 件 ， 在 其 中 消息 被 产生 和 消耗 。 设 M 是 可 能 消息 的 集合 。 用 M( M) 表示 来 自 MM 中 
元 素 的 多 集 的 集合 。 

定义 2.4 ”定义 进程 的 局 部 算法 为 五 元 组 (Z，1， H, 上，)， 其 中 Z 表 示 状 态 集 ，7 表 
示 初 始 状 态 Z 的 子 集 ， 上 表示 Z x Z 上 的 关系 ， 上 :和 上 | 上" 表示 Zx AM x Z 上 的 关系 ，Z 上 的 二 元 关 
系 上 定义 如 下 : 

chd <> (c,d) et v Ime M((c,m,d) EF UE). 


RAE, FA 上 分 别 表示 关于 内 部 事件 、 发 送 事件 和 接收 事件 的 状态 转移 。 以 下 ， 用 p， 
4，r，P1，P2 等 表示 进程 。 用 P 表 示 系统 中 进程 的 集合 。 定 义 2.4 作 为 进程 的 理论 模型 ， 当 然 ， 
本 书 并 不 用 列举 进程 的 状态 和 事件 来 描述 算法 。 而 是 用 便利 的 伪 随 机 代码 (参见 附录 A ) 描述 。 
进程 的 执行 就 是 转移 系统 (Z, H, 1) 的 执行 
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然而 ， 我 们 对 整个 系统 的 执行 感 兴趣 ， 在 这 样 的 执行 中 ， 进 程 的 执行 通过 通信 子 系统 来 
协调 进行 。 为 描述 这 种 协调 关系 ， 把 分 布 式 系统 定义 为 转移 系统 ， 其 中 的 配置 集 、 转 移 关 系 
以 及 初始 状态 由 进程 的 相应 分 量 来 构造 。 

定义 2.5 定义 进程 集 P = {Pij，.… ，pw} 的 分 布 式 算法 为 局 部 算法 的 集会 ， 中 的 每 一 进程 
代表 一 个 局 部 算法 。 

分 布 式 算 法 的 行为 可 用 如 下 转移 系统 描述 。 配 置 由 每 一 进程 的 状态 和 传输 中 的 消息 集 组 
成 ; 转移 是 进程 中 的 事件 ， 不 仅 影 响 到 进程 的 状态 ， 而 且 影 响 到 消息 集 (或 被 消息 集 影 
Wel) ; 进程 在 初始 状态 且 消 息 集 为 空 时 的 配置 为 初始 配置 。 

定义 2.6 在 异步 通信 条 件 下 ， 由 进程 p1, .… , pn 的 分 布 式 算 法 (进程 p; 的 局 部 算法 为 (2， 


Ih,» Hp,» Fs 和 Fp) 所 导出 的 转移 系统 定义 为 $= (C, >, I1), 2H 
(1) C={ (cr， ws Cpy ， M): (VWpEP:c,€Z,) BMEM (M) }, 


(2) += (Upp 一 ,)， 其 中 一 ,表示 与 进程 p 的 状态 变化 相对 应 的 转移 ; 一 表示 序 偶 的 集合 


r 
(e, genes Cp rel py „M, Jle, rly, C py „M, ) 


下 列 三 个 条 件 之 一 成 立 : 

* (cp, ch) EH, AMi =M; 

“对 某 些 mE 人 (cy, m, ch) E Fp, HM,=M,U {m}; 

。 对 某 些 mE M ， (cp, m, C'h) E€ F; EŁM,=M,U {m}; ; 

(3) T ={ (cr， vs py > M): (WpEP: EL) A M=O}, 

分 布 式 算法 的 一 次 执行 就 是 导出 的 转移 系统 的 一 次 执行 。 一 次 执行 中 的 事件 对 于 下 列 记 
号 是 显 式 执行 的 。 称 序 偶 (c, d) E 上 ,为 进程 p 的 (可 能 的 ) 内 部 事件 。 上 ,和 上 ,中 的 三 元 组 
称 为 进程 的 发 送 和 接收 事件 。 

* 在 配置 y = (Cpo -> Cos es Cry > M) 中 ， 如 果 c, = c， 则 称 p 中 的 内 部 事件 e = (c, d) 

是 可 应 用 的 《applicable )。 在 这 种 情况 下 ,定义 e(Y) H (cps -> d, vs Cpy > M)。 

* 在 配置 7 = (Cpo > Cp -o Copo M) H, Re, = c， 则 称 p 中 的 发 送 事件 e = (c, m, 

d) 是 可 应 用 的 。 在 这 种 情况 下 ， 定 义 e (y) H (c> > d, s Cy» MU{m})。 

在 配置 Y= (Cp. > Cpr o Coy» M) 中 ， 如 果 co = c 且 m E M， 则 称 p 中 的 接收 事件 e = 

(c, m, d) 是 可 应 用 的 。 在 这 种 情况 下 ， 定 义 e (7) 为 (cn > d, ns Coys M\{m})。 

假设 对 于 每 一 消息 ， 存 在 惟一 进程 接收 该 消息 。 称 此 进程 为 消息 的 目的 地 。 


2.1.3 同步 消息 传递 系统 


如 果 一 个 发 送 事件 及 对 应 的 接收 事件 协同 形成 系统 的 一 个 转移 ， 则 称 消息 传递 是 同步 的 。 
即 ， 在 消息 的 目的 地 准备 接收 消息 时 ， 进 程 才 能 发 送 消息 。 因 此 ， 有 两 种 类 型 的 系统 转移 : 
一 种 是 进程 内 部 状态 的 变化 ， 另 一 种 是 两 个 进程 之 间 的 组 合 通信 事件。 

定义 2.7 在 同步 通信 条 件 下 ， 由 进程 P|，... ，pw 的 分 布 式 算 法 所 导出 的 转移 系统 定义 为 5 
三 (C， 一 ， 工 ), 其 中 

(1) C={ (cn， vee Cpp): VpEP: EZ}. 

(2) = = (Upe >p) U (Up ger:peg7 p), HF 


[46] 


[47| 





I , io 
(e, ye Cp oe Con EGA rers Cm co | 集合 ， 其 中 (e, Cp, Je Fis 


其 中 存在 消息 m E MM ， 满 足 
(cp m, ch) © My, (cy, m, ch) E€ Fp, 

(3) T ={(€p s 1, Copy ) : (YPEP : GEL )}. 

一 些 分 布 式 系统 允许 混合 形式 的 通信 ; 系统 中 的 进程 以 同步 方式 及 异步 方式 采用 通信 原 
语 进行 消息 传递 。 给 定 上 述 定义 的 两 种 模型 ， 不 难为 这 种 类 型 分 布 式 系统 设 计 一 种 形式 模型 。 
这 种 系统 的 配置 包括 进程 的 状态 和 传输 中 的 消息 集 ( 即 ， 同 步 消息 )。 转 移 包 括 所 有 出 现在 定 
义 2.6 和 定义 2.7 中 的 转移 类 型 。 

同步 及 其 对 算法 的 影响 

如 前 所 述 ， 可 以 把 多 种 用 途 的 同步 消息 传递 看 作 是 异步 消息 传递 的 特例 。 对 于 那些 每 次 
发 送 事件 又 紧 跟 着 对 应 的 接收 事件 [CBMT96] 的 执行 ， 执 行 集 限制 在 同步 消息 传递 的 情况 内 。 
因此 ， 我 们 认为 异步 消息 传递 是 比 同步 消息 传递 更 具 通 用 性 的 模型 ， 并 将 主要 为 这 一 通用 情 
况 开 发 算法 。 

然而 ， 值 得 注意 的 是 ， 为 异步 消息 传递 系统 所 开发 的 算法 是 否 能 在 同步 消息 传递 系统 中 
执行 。 简 化 的 通信 子 系统 的 不 确定 性 必须 通过 增加 进程 的 不 确定 性 达到 平衡 ， 否 则 就 会 导致 
死 锁 。 

用 一 个 基本 例子 来 说 明 ， 两 个 进程 相互 发 送 消息 的 情形 。 在 异步 情况 下 ， 每 一 进程 必须 
首先 发 送 一 条 消息 ， 随 后 接收 其 他 进程 的 消息 。 在 进程 的 发 送 和 接收 过 程 之 间 ， 消 息 被 暂时 
放 在 通信 子 系统 的 缓冲 区 中 。 同 步 的 情况 ， 不 可 能 存在 这 样 的 缓冲 区 。 如 果 两 个 进程 必须 在 
接收 消息 之 前 发 送 它们 各 自 的 消息 ， 就 不 会 发 生 转 移 。 在 同步 情况 下 ， 进 程 必须 接 到 另 一 进 
程 的 消息 ， 才 能 发 送 自己 的 消息 。 不 用 说 ， 如 果 两 个 进程 必须 接 到 消息 ， 才 能 发 送 它 们 各 自 
的 消息 ， 也 不 会 发 生 转 移 。 

同步 系统 中 ， 只 有 当 满 足下 列 两 个 条 件 之 一 ， 才 能 进行 信息 交换 。 

(1) 预先 可 以 确定 ， 哪 个 进程 先 发 送 ， 哪 个 进程 先 接收 。 在 许多 情况 下 ， 不 可 能 预先 做 
出 选择 ， 因 为 这 需要 两 个 进程 执行 不 同 的 局 部 算法 。 

(2) 进程 具有 不 确定 的 选择 ， 要 么 先 发 送 后 接收 ， 要 么 先 接收 后 发 送 。 在 每 次 执行 中 ， 
为 每 一 进程 选择 一 种 可 能 的 执行 次 序 ， 即 打破 进程 通信 子 系统 的 对 称 性 。 

当 我 们 为 异步 消息 传递 设计 一 种 算 靶 ， 并 阐明 该 算法 同样 可 适用 于 同步 消息 传递 ， 这 种 
确定 性 〈 总 是 可 能 的 ) 的 增加 被 隐 含 地 做 了 假设 。 


2.1.4 公平 性 


在 某 些 情况 下 ， 必 须 对 系统 的 行为 限制 到 所 谓 的 公平 执行 。 公 平 性 条 件 排除 了 某 些 事件 


总 是 (常常 无 限 ) 可 用 但 从 发 生 转 移 的 情况 (因为 它们 会 随 其 他 可 应 用 事件 继续 执行 )。 


定义 2.8 ”在 无 限 多 连续 配置 中 ， 且 该 配置 没有 发 生 在 执行 过 程 中 ， 如 果 没 有 事件 是 可 应 
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用 的 ， 则 称 执行 是 弱 公 平 的 (weakly fair)。 在 无 限 多 配置 中 ， 且 该 配置 没有 发 生 在 执行 过 程 
中 ， 如 果 没 有 事件 是 可 应 用 的 ， 则 称 执行 是 强 公平 的 〈strongly fair), 

在 明确 的 形式 模型 中 ， 可 能 会 将 公平 性 条 件 结合 进去 。 正 如 Manna 和 Pnueli 所 作 的 那样 
[MP88]。 本 书 中 的 大 多 数 算法 不 依赖 于 这 些 条 件 ; 因此 我 们 的 算法 将 不 结合 这 些 条 件 。 但 是 
在 它们 应 用 到 某 一 特定 算法 和 问题 时 ， 我 们 会 明确 地 阅 明 这 些 条 件 。 同 时 对 在 分 布 式 模型 中 
包含 公平 性 假设 是 否 合理 展开 辩论 。 在 算法 中 不 做 公 平 性 假设 ， 使 得 算法 设计 不 依赖 于 这 些 
假设 。 对 有 关公 平 性 假设 的 某 些 复杂 问题 的 讨论 可 参见 [Fra86]。 


2.2 转移 系统 性 质 的 证 明 


给 定 某 一 问题 的 分 布 式 算法 ， 需 要 证 明 算 法 是 问题 的 一 个 正确 解 。 问 题 明 确 了 所 求 算法 
必 有 的 性 质 ， 问 题 的 解 必须 具有 这 些 性 质 。 验 证 分 布 式 算法 的 问题 已 经 受到 广泛 的 关注 ， 并 
且 大 量 的 文献 讨论 形式 化 验证 方法 ， 参 见 [CM88, Fra86, Kel76, MP88]。 本 节 中 ， 我 们 用 一 些 
简单 却 常 用 的 方法 证 明 分 布 式 算法 的 正确 性 。 这 些 方法 依赖 于 转移 系统 的 定义 。 

可 将 分 布 式 算法 其 有 的 性 质 分 为 两 类 : 安全 性 要 求 和 活动 性 要 求 【liveness requirement). 
算法 的 安全 性 要 求 是 指 ， 对 于 系统 的 每 一 次 执行 ， 以 及 那 次 执行 达到 的 每 个 配置 ， 所 应 有 的 
性 质 必 须 保 持 。 算 法 的 活动 性 要 求 是 指 ， 对 于 系统 的 每 一 次 执行 ， 以 及 那 次 执行 达到 的 某 些 
配置 ， 所 应 有 的 性 质 必须 保持 。 关 于 构成 安全 性 和 活动 性 的 形式 描述 参见 Alpern 和 
Schneider[AS85]。 文 献 表 明 ， 每 种 可 能 的 规范 (执行 集 的 性 质 ) 都 可 以 看 成 是 安全 性 和 活动 
性 的 结合 。 

这 些 要 求 也 可 能 以 弱化 的 形式 出 现 。 例 如 ， 它 们 必须 满足 可 能 执行 集 上 的 某 种 固定 概率 
分 布 。 其 他 对 于 算法 的 要 求 ， 可 能 包括 某 一 给 定 知识 的 运用 (参见 2.4.4 节 )， 对 某 些 进程 的 故 
障 具 有 弹性 (参见 第 三 部 分 )， 以 及 进程 是 同等 的 (参见 第 9 章 ) 等 。 

本 节 中 所 描述 的 验证 方法 ， 基 于 一 次 执行 中 所 达 配 置 的 断言 (assertion) 的 真 值 。 这 种 方 
法 称 为 断言 式 验 证 方法 。 一 个 断言 是 配置 集 上 的 一 元 关系 ， 即 ， 对 于 配置 的 一 个 子 集 谓词 为 
真 ， 其 他 为 假 。 


2.2.1 安全 性 


算法 的 安全 性 是 指 : “在 算法 每 次 执行 的 每 次 配置 中 ， 断 言 P 为 真 "。 用 非 形式 化 的 语言 ， 
可 描述 为 “断言 P 总 是 为 真 (true)"。 按 照 下 列 所 给 定义 ， 证 明 断 言 P 总 是 为 真 的 基本 技术 ， 
是 要 证 明 P 是 不 变 式 〈invariant)。 记 号 P (y) 是 布尔 表达 式 ， 如 果 P 在 y 中 成 立 ， 其 值 为 真 ; 
否则 为 假 ， 其 中 ?表示 配置 。 

这 些 定义 与 给 定 的 转移 系统 3 = (C, >, T) 有 关 。{P} > {0Q} 表 示 、 对 于 5 的 每 一 次 转 
By > ô, MRP(y), WMO). {P} 一 {0} 含义 是 ， 如 果 P 在 任 一 转移 之 前 成 立 ， 那么 C 在 转移 
之 后 成 立 。 

定义 2.9 断言 P 是 5 的 一 个 不 变 式 ， 如 果 

(1) 对 所 有 YEI ，P(X) 成 立 ,， 且 

(2) {P} > {P}. 

定义 表明 ， 在 每 次 初始 配置 中 ， 不 变 式 成 立 。 并 在 每 次 转移 过 程 中 保持 不 变 。 由 此 可 得 ， 
在 每 一 可 达 的 配置 中 ， 不 变 式 成 立 。 表 述 成 如 下 定理 。 
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定理 2.10 如 果 P 是 5 的 一 个 不 变 式 ， 那 么 对 于 5 的 每 次 执行 的 每 一 配置 ，P 成 立 。 

证 明 。 设 E = (yo, Nis Yo» =) 是 5 的 一 次 执行 。 用 归纳 法 证 明 ，、 对 于 每 个 i，P(y;) 成 立 。 
首先 ， 因 为 hEI ， 且 由 定义 2.9 的 第 一 个 条 件 ，P(yo) 成 立 。 其 次 ， 假设 PY; or, Ay 一 yin 
是 出 现在 E 中 的 一 次 转移 。 由 定义 2.9 的 第 二 个 条 件 ，P(y;1) 成 立 。 定 理 证 毕 。 

相反 地 ， 并 不 是 在 每 次 执行 的 每 一 配置 都 成 立 的 断言 就 是 不 变 式 (参见 练习 2.2)。 因 此 ， 
并 不 是 每 一 安全 性 质 都 能 利用 定理 2.10 来 证 明 。 然 而 ， 不 变 式 蕴 含 每 次 断言 总 是 为 真 ; 可 用 
以 下 定理 证 明 断 言 总 是 真 的 。( 需 要 注意 的 是 ， 当 用 此 定理 时 ， 要 找 一 个 合适 的 不 变 式 @ 常 常 
是 非常 困难 的 。 ) 

定理 2.11 ROASHRERX, 假设 0 >P (对 于 每 一 y E C)。 那 么 P 在 S 的 每 次 执行 的 每 
一 配置 中 成 立 。 

证 明 。 由 定理 2.10， 在 每 个 配置 中 ，Q 成 立 。 因 为 0 蕴含 P， 在 每 个 配置 中 ，P 也 成 立 。 口 

有 了 时 首先 证 明 弱 不 变 式 是 有 用 的 ， 接 着 利用 这 一 结果 来 证 明 强 不 变 式 。 下 列 的 定义 和 定 
理 证 明了 如 何 使 一 个 不 变 式 成 为 强 不 变 式 。 

定义 2.12 设 5 是 转移 系统 ，P，Q 是 断言 。 称 P 为 0- 导出 的 ， 如 果 

(1) 对 所 有 YEI ，Q(y) = P; 且 

(2) {Q A P} > {0 = P}. 

定理 2.13 如 果 Q 是 不 变 式 ，P 是 QO- 导出 的 ， 那 么 OQ 入 P 是 不 变 式 。 

证 明 。 按 照 2.9 的 定义 ， 要 证 

(1) 对 所 有 YEI , OYA P); E. 

(2) {QAP} +{QA P}. 

因为 @ 是 不 变 式 ， 对 所 有 y ET ，Q(y) 成 立 ， 且 对 所 有 y ET , Q= P(O) ， 对 所 有 7y ET. 
P(D) 成 立 。 因 此 ， 对 所 有 YEI , OYA PRX. 

假设 7 -> SEA P(D)。 因 为 2 是 不 变 式 ，Q(6) 成 立 ， 又 因为 {QA P} 一 {0 二 P}, Qô) 
=P(ô), hik, PORZ FE., QA P(6) 成 立 。 o 

在 3.1 节 给 出 了 本 节 安 全 性 例子 的 证 明 。 


2.2.2 活动 性 


算法 的 活动 性 是 指 :“ 在 算法 每 次 执行 的 某 些 配 置 中 ,断言 P 为 真 "。 用 非 形式 化 的 语言 ， 
即 为 “断言 P 最 终 为 真 "。 证 明 断 言 P 最 终 为 真 的 基本 技术 是 范 函数 和 无 死 锁 性 (deadlock- 
freeness) 或 者 正常 终止 (proper termination )。 算 法 中 使 用 的 简单 技术 是 只 允许 固定 有 限 的 执 
行 。 

设 $ 表 示 转 移 系 统 ，P 是 一 个 谓词 。 定 义 term 为 谓词 ， 它 在 所 有 最 终 配置 中 为 真 ， 在 所 有 
非 最 终 配 置 中 为 候 。 我 们 首先 考虑 达到 最 终 配 置 的 执行 。 通 常 ， 人 们 不 希望 这 样 的 配置 ， 对 
于 该 配置 ， 不 能 达到 “目标 ”P， 这 就 是 人 们 所 说 的 死 锁 情形 。 另 一 方面 ， 如 果 目 标 P 已 经 达 
到 ， 则 认为 终止 ;这 就 是 人 们 所 说 的 正常 终止 的 情形 。 

定义 2.14 如 果 谓 词 (term 一己 ) 在 8 中 总 是 为 真 ， 则 系统 8 正常 终止 (或 者 无 死 锁 )。 

范 国 数 依靠 良 基 集 (well-founded) 的 数学 概念 。 这 是 一 个 具有 序 < 的 集合 ， 其 中 不 存在 
无 穷 递减 的 序列 。 


定义 2.15 称 一 个 偏 序 集 (W, <) 是 良 基 的 ， 如 果 不 存 在 无 穷 递减 序列 
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wi >W, > Ws 


本 书 中 所 用 良 基 集 的 例子 是 具有 通常 序 的 自然 数 和 具有 字典 序 的 自然 数 的 n- 元 组 (参见 4.3 
节 )。 和 良 基 集 中 不 存在 无 穷 递减 序列 的 性 质 可 用 于 证 明 断 言 P 最 终 为 真 。 要 证 明 这 一 点 ， 就 要 证 
明 ， 存 在 一 个 从 C 到 良 基 集 玫 的 国 数 六 ， 满 足 在 每 次 转移 过 程 中 ，j 的 值 递减 ， 或 者 P 变 为 真 。 

定义 2.16 ”给 定 转移 系统 S 和 断言 PP。 称 从 C 到 良 基 集 几 的 函数 /为 范 函 数 (AFP), wR 
对 于 每 次 转移 y 一 6,，f (7) > (6) 或 者 已 (5) 成 立 。 

定理 2.17 给 定 转移 系统 S 和 断言 P。 如 果 $ 正 常 终止 ， 且 范 函数 让 (关于 P) 存在 ， 那 么 在 
S$ 每 次 执行 的 某 些 配置 中 PP 为 真 。 

证 明 。 设 E = (Yos n, s =) 表示 5 的 一 次 执行 。 如 果 E 是 有 限 的 ， 它 的 最 终 配 置 是 一 个 
终止 配置 ， 并 且 在 $ 中 当 谓词 term =>P 总 是 为 真 时 ，P 在 此 配置 中 成 立 。 如 果 E 是 无 限 的 ， 设 EE' 
是 E 的 最 长 前 级 ， 其 中 不 存在 P 为 真 的 配置 ， 设 s 为 所 有 出 现在 E' 中 ， 所 有 配置 y; 构成 的 序列 
(f(yo)， 了 (7?)，…)。 由 E' 的 选择 和 /的 性 质 ，s 是 递 碱 序列 ， 因 此 由 W 的 良 基 性 ，s 是 有 限 的 。 
这 也 表明 ，E' 是 E 的 一 个 有 限 前 级 《yo，y1，… ,Xx)。 由 EE 的 选择 ，P(y ,i) 成 立 。 口 

如 果 假 定 公 平 性 质 ， 由 弱 前 提 (定理 2.17) 就 可 得 出 P 最 终 为 真 ; 范 函数 的 值 不 必 随 每 次 
转移 递减 。 公 平 性 假设 可 用 于 证 明 ， 无 限 次 执行 包含 某 种 类 型 的 转移 是 无 限 的 。 进 而 能 够 证 
明 / 永 不 递增 ,但 却 随 着 这 种 类 型 的 每 次 转移 递减 。 

在 某 些 情况 下 ， 我 们 将 利用 下 述 结果 ， 它 是 定理 2.17 的 特例 。 

定理 2.18 ”如果 3 正常 终止 ， 且 存在 数 开 ， 满 足 每 次 执行 至 多 包含 民 次 转移 ， 那 么 在 每 次 执 
行 的 某 些 配置 中 ，P 为 真 。 


2.3 事件 的 因果 序 和 逻辑 时 钟 


将 执行 看 作 转 移 的 序列 很 自然 地 引出 执行 中 的 时 间 表 示 。 如 果 a 在 序列 中 出 现在 b 之 前 ， 
就 称 转移 a 出 现在 转移 b 之 前 。 对 于 执行 E = (yo，y1，…)， 定 义 相关 的 事件 序列 EE = (leo e, 
…)， 其 中 e 表 示 事件 ， 通 过 此 事件 ， 配 置 从 y 变 到 yj 。 可 见 ， 用 这 种 方法 ， 每 次 执行 定义 了 
疏 一 的 一 个 事件 序列 。 可 以 用 时 空 图 (space-time diagram) 来 可 视 化 执行 过 程 。 图 2-1 给 出 了 
一 个 例子 。 在 图 中 ， 水 平 线 表示 进程 ， 进 程 线 上 的 一 个 点 表示 一 个 事件 ， 它 的 位 置 表 示 事 件 
发 生 的 地 方 。 如 果 消 息 m 在 事件 s 中 发 送 ， 在 事件 r 中 接收 ， 就 从 s 到 7 画 一 个 箭头 ， 在 这 种 情况 
下 ， 称 事件 s 和 r 是 对 应 事件 。 
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图 2-1 时 空 图 的 一 个 例子 
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正如 在 2.3.1 节 可 看 到 的 ， 分 布 式 执行 中 的 事件 有 时 可 以 相互 交换 ， 而 不 影响 以 后 执行 的 
配置 。 因 此 ， 把 时 间作 为 执行 中 事件 的 全 序 ， 并 不 适合 于 分 布 式 执行 。 因 此 引入 了 因果 相关 
表示 法 。 在 事件 的 重新 排列 之 下 ，2.3.2 节 研究 了 执行 的 等 价 性 。 在 2.3.3 节 讨论 了 如 何 定 义 用 
于 测量 因果 相关 性 的 时 钟 (而 不 是 时 间 )， 提 出 了 Lamport 的 逻辑 时 钟 ， 给 出 了 这 种 时 钟 的 一 
个 例子 。 


2.3.1 事件 的 独立 性 和 相关 性 


分 布 式 系统 的 转移 只 影响 到 (或 者 受到 影响 ) 配置 的 一 部 分 。 由 此 可 见 ， 影 响 配 置 不 同 
部 分 的 两 个 连续 事件 ， 是 独立 的 ， 并 且 可 以 以 相反 的 次 序 出 现 。 对 于 具有 异步 消息 传递 的 系 
统 ， 可 以 表述 成 下 面 的 定理 。 

定理 2.19 “” 设 y 是 分 布 式 系统 的 一 个 配置 (具有 异步 消息 传递 ) ，er 和 e, 分 别 是 不 同 进程 P 
和 9 中 的 事件 ， 它 们 在 y 中 是 可 应 用 的 。 那 么 ，er 在 er( 力 中 是 可 应 用 的 ，ey Ke (y PETA, 
H He, (e,(y)) = ey (ep (7)) o 

证 明 。 为 避免 分 析 发 送 事件 、 接 收 事件 或 者 内 部 事件 的 一 种 ， 将 每 一 事件 表示 成 一 致 的 
形式 (c,，x，y，d)。 这 里 ，c 和 4d 分 别 表示 事件 前 、 后 的 进程 状态 ，x 是 事件 所 接收 的 消息 集 ， 
) 是 事件 所 发 送 的 消息 集 。 因 此 ， 内 部 事件 (c, d) TRA (c, Ø, D, d); 发 送 事件 〈c， 
m, d) 可 表示 为 (《c， 名 ，{m}，d)， 接 收 事件 (c, m, d) 可 表示 为 (c，{m}, Ø, d). Æ 
于 这 种 表示 法 ， 如 果 c, = c 且 x CM， 则 进程 p 中 的 事件 e =(c, x, y, d) 在 配置 Y=(cp，…, Cp 

> Cp» M) 中 是 可 应 用 的 。 在 这 种 情况 下 


CY) = (Cp send, (MA XUy), 


现 假设 e = (bp, Xps Yp> d,) 和 es = (b,, Xq> Yg» d,) 在 


中 是 可 应 用 的 。 即 ，c = b, Cg = by, % CM， 和 xs C M。 重 要 的 观察 是 x, 和 x, 不 相交 ; Xp 
中 的 信息 (GORA) 目的 地 为 p， 而 六 中 的 信息 (如 果 有 ) 目的 地 为 g。 
记 为 =er(y)， 注 意 ， | 
Vp = (d,s sca (M \ x, )UY,) 0 
因为 x, CMH x, 站 zw = 9, HURT, x, C (M\x, U y,)， 因 此 e, 在 中 是 可 应 用 的 。 记 
Yoa = €a Y) HA 
Y pq = (dpsed sn (M\x,Uy,)\x,)UY,) « 
由 对 称 性 ， 可 以 得 出 ， ep 在 yy = ey) 中 是 可 应 用 的 。 WY ep = €p (%), 注意 
Yap = (Gd (M \ x Uy,)\x,Uy,)) o 
因为 M 是 消息 的 多 集 , x, CM, Ax, CM, C 
(M\ x Uy \ x Uyg) =(M\ x,Uy,)\ x, Uy,) ， 
BIE Ypg = Yopo 口 


设 e, 和 es 是 出 现在 一 次 执行 中 的 两 个 连续 事件 ， 即 对 于 某 些 x， 执 行 包括 子 序列 
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-Y€ (y) ele, (7), 


把 定理 2.19 的 前 提 应 用 到 这 些 事件 ， 除 去 下 列 两 种 情况 。 

(1) p=q; 或 者 

(2) es 是 发 送 事 件 ，es 是 对 应 的 接收 事件 。 

的 确 ， 定 理 明 确 地 表明 p 和 gq 必须 不 同 ， 且 如 果 es 接 收 到 e, 中 所 发 送 的 消息 ， 接 收 事件 就 不 
能 应 用 到 e, 的 初始 配置 中 ， 正 如 所 要 求 的 。 因 此 ， 如 果 这 两 种 说 法 其 一 为 真 ， 那 么 事件 就 不 
能 以 相反 次 序 出 现 ; 否则 ， 车 它们 以 相反 的 次 序 出 现 ， 就 会 导致 同样 配置 。 注 意 ， 从 全 局 的 
角度 来 看 ， 转 移 是 不 能 交换 的 ， 这 是 因为 (定理 2.19 中 的 表示 ) 从 到 ys 的 转移 不 同 于 从 7y 到 ”。 
的 转移 。 然 而 ， 从 进程 的 角度 来 看 ， 这 些 享 件 是 不 能 区 别 的 。 

某 一 对 事件 不 能 交换 的 事实 表明 ， 这 两 个 事件 之 间 存 在 因果 关系 。 这 个 关系 可 被 扩展 成 
执行 事件 集 上 的 偏 序 ， 称 为 执行 的 因果 序 。 

定义 2.20 设 E 是 一 次 执行 。 称 因果 序 的 关系 < 是 执行 事件 上 满足 下 列 条 件 的 最 小 关系 。 

(1) 如 果 e 和 /是 同一 进程 中 的 不 同事 件 ，e 在 /之 前 出 现 ， 那 么 g <f, 

(2) 如 果 s 是 发 送 事件 ，r 是 对 应 的 接收 事件 ， 那 么 ，s < r。 

(3) < 是 可 传递 的 。 ， ' 

用 a < b 来 表示 (a < b V a =b)。 因 为 < 是 偏 (partial) 序 ， 则 可 能 存在 事件 as，b， 使 
得 a < b 和 b < a 都 不 成 立 。 称 这 些 事件 是 并 发 的 ， 记 为 alb。 在 图 2-1 中 ,5 Nf，d li 等 并 发 。 
Lamport[Lam78] 首 先 定 义 了 因果 序 。 因 果 序 在 分 布 式 算法 的 推理 中 起 着 重要 作用 。 < 的 定义 
蕴含 在 因果 相关 的 事件 之 间 存 在 因果 链 。 用 此 表示 法 ，a < 8 表示 存在 序列 ae =e, 6, =, e 
= b， 链 中 的 每 一 连续 事件 对 ， 或 满足 定义 2.20 中 的 (1)， 或 满足 定义 中 的 (2)。 可 以 选择 因 
果 链 ， 使 得 满足 条 件 (1) 的 每 一 对 事件 都 是 它们 所 出 现 的 进程 中 的 连续 事件 ， 即 ， 它 们 之 间 
没有 其 他 事件 。 在 图 2-1 中 ， 事 件 a 和 ! 之 间 的 因果 链 是 序列 a, f, g, h, j,k, L 


2.3.2 执行 的 等 价 性 : 计算 


只 要 与 因果 序 一 致 ， 执 行 中 的 事件 可 以 任意 重新 排列 而 不 影响 执行 的 结果 。 事 件 的 重 排 
过 程 引 出 了 不 同 的 配置 序列 ， 但 是 ， 可 以 认为 这 个 执行 与 原 执行 等 价 。 

设 f = (fo. fis fas c+) 表示 事件 序列 。 这 个 序列 是 与 执行 F = (6， 6, &, +) 有 关 的 
事件 序列 ， 如 果 对 于 每 一 个 i，f 在 5 中 是 可 应 用 的 ， 并 且 fi (5) =6.,1)。 如 果 情 况 的 确 如 此 ， 称 
为 序列 /的 隐 执 行 (implied execution)。 我 们 想 让 F 由 f 惟一 确定 。 但 情况 并 非 总 是 如 此 ; 如 
果 对 某 些 进程 >，P 中 的 所 有 事件 都 不 在 Ah 中 ， 那 么 ，p 的 状态 可 以 是 任意 初始 状态 。 然 而 ， 如 
果 / 至 少 包含 p 中 的 一 个 事件 ， 那 么 p 中 的 第 一 个 事件 (c, x, y, d) 定义 了 p 的 初始 状态 c。 因 
而 ， 如 果 盏 少 包含 每 一 进程 中 的 一 个 事件 ， 且 上 惟一 定义 ， 也 就 惟一 地 定义 了 整个 执行 。 

BE = (yo. Yo 0) 是 与 事件 序列 = (eo，ei，…) 有 关 的 一 次 执行 并 假设 是 8 的 一 个 
排列 。 这 表明 ， 存 在 自然 数 (或 者 ， 如 果 E 是 k 个 事件 的 有 限 执行 ， 为 集合 {0，…,， -1}) 的 
一 个 排列 oc， 满足 = cows WRA SASI < j， 则 E 中 事件 的 排列 (万 ,月 ,上 户 ，…) 与 因果 
序 一 致 ， 即 因果 上 有 前 后 关系 的 事件 在 序列 中 保持 同样 的 顺序 关系 。 

定理 2.21 W= (fo. fi, fo) 表示 EE 中 的 事件 排列 ， 它 与 中 因果 序 一 致 。 那 么 f 定 义 
了 帷 一 的 执行 RF， 它 开始 于 E 的 初始 配置 。 中 的 事件 同样 多 ， 并 且 如 果 E 是 有 限 的 ， 则 FF 的 
最 终 配置 和 E 的 最 终 配置 相同 。 
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证 明 。 逐 步 构造 F 的 配置 ， 要 构造 6 ， 就 要 证 明 / 在 5 中 是 可 应 用 的 。 取 & =y. 

假设 对 于 所 有 i <i, AERC HOP TAR, How =f (6)。 令 2 = (Cp > Coys M) 
Wh=(c, x, y, d) 是 进程 p 中 的 事件 ; 如 果 c, = c 且 x C MM， 则 事件 f 在 56, 中 是 可 应 用 的 。 

为 证 明 c, = c， 我 们 讨论 两 种 情况 。 在 这 两 种 情况 下 ， 可 注意 到 ，E 的 因果 序 完全 确定 了 
进程 p 中 事件 的 次 序 ; 这 就 意味 着 进程 p 中 的 事件 出 现 的 次 序 与 和 天 中 的 事件 次 序 完 全 相同 。 

情况 1: f 是 /中 进程 p 的 第 一 个 事件 ; 则 cs 是 p 的 初始 状态 。 然 而 也 是 E 中 进程 p 的 第 一 个 
事件 ， 这 意味 着 c 是 p 的 初始 状态 。 因 此 ，c = cr。 

情况 2: /不 是 中 进程 p 的 第 一 个 事件 ; 令 在 /之 前 , f 中 p 的 最 后 一 个 事件 为 f' = (ci, x', y', 
d)， 那 么 cv = 必然 而 帮 也 是 天 中 进程 p 的 最 后 一 个 事件 (ji 之 前 )， 这 意味 着 c = d'。 因 此 ,c= 
Cpo 

为 证 明 x C M, RIERA ERHI R ERRARE RFR. WETERE 
件 ， 则 x = 名 和 x C MIL Rar. WREKE, AE RRS. AA fi j <i 
成 立 ， 即 发 送 事件 在 让 的 /之 前 ; 因此 , x CM. 

我 们 已 证 明 ， 对 于 每 一 i，f 在 6 中 是 可 应 用 的 ， 可 取 65, 为 (6)。 最 后 必须 证 明 ， 如 果 E 是 
有 限 的 ，F 和 E 的 最 终 配 置 相同 。 设 y 是 E 中 的 最 后 配置 。 如 果 E 不 含 p 中 的 事件 ，yi 中 p 的 状态 
等 于 它 的 初始 状态 。 由 于 f 也 不 含 p 中 的 事件 ，65. 中 p 的 状态 也 等 于 它 的 初始 状态 ， 因 此 ，6. 中 p 
的 状态 等 于 它 在 hh 中 的 状态 。 否 则 ，%X 中 p 的 状态 就 是 E 中 进程 p 的 最 后 一 个 事件 之 后 的 状态 ; 
这 也 是 f 中 进程 p 中 的 最 后 事件 ， 因 此 ， 这 也 是 6 中 进程 p 的 状态 。 

在 Xx 中， 传输 中 的 消息 恰好 是 有 中 的 发 送 事 件 与 对 应 的 接收 事件 不 相 匹配 的 消息 。 但 是 五 
和 /包含 同样 的 事件 集 ， 在 F 的 最 终 配置 中 ， 传 输 的 是 相同 消息 。 口 

执行 F 和 E 具 有 相同 的 事件 集 ， 且 这 些 事件 的 因果 序 相同 。 因此，E 是 F 中 事件 的 一 个 排列 ， 
且 因 果 序 相同 。 如 果 应 用 定理 2.21 中 条 件 ， 则 称 E 和 FF 为 等 价 执 行 ， 表 示 为 E ~ FP. 

图 2-2 表 示 执 行 的 时 间 图 ， 该 图 与 图 2-1 等 价 。 用 “橡皮 圈 转 换 ”[Mat89c] 可 得 到 等 价 的 时 
间 图 。 假 设 进程 的 时 间 轴 可 被 压缩 和 被 拉 伸 ， 只 要 保持 消息 的 箭头 “向 右 ”， 就 可 以 把 图 2-1 
变 成 图 2-2。 
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图 2-2 与 图 2-1 等 价 的 时 空 图 


尽管 所 描述 的 执行 是 等 价 的 并 包含 同样 多 的 事件 ， 但 是 它们 并 不 包含 相同 的 配置 集 。 图 
2-1 中 包含 的 一 个 配置 (y")， 其 中 事件 e 中 所 发 送 的 消息 和 事件 ! 中 所 发 送 的 消息 同时 传输 。 
2-2 并 不 包含 这 样 的 配置 ， 这 是 因为 事件 中 所 发 送 的 消息 在 事件 e 发 生 之 前 收 到 。 

可 以 访问 实际 事件 序列 的 全 局 观测 器 ， 能 辨别 出 两 个 等 价 执行 。 即 ， 能 区 别 出 是 哪 一 个 
在 执行 。 然 而 ， 进 程 不 能 辨别 两 个 等 价 的 执行 ， 因为 它们 不 可 能 区 别 出 这 两 个 等 价 的 执行 是 
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哪 一 个 在 执行 。 说 明 如 下 。 假 设 必 须 决定 ， 是 否 事件 e 中 所 发 送 的 消息 和 事件 ! 中 所 发 送 的 消息 
同时 传输 。 在 其 中 的 一 个 进程 中 有 一 布尔 变量 sim， 如 果 消 息 同时 传输 ， 必 须 将 该 变量 设 为 
A: 否则 ， 读 变量 为 假 。 在 图 2-1 的 最 终 配 置 中 ，sim 为 真 。 在 图 2-2 的 最 终 配置 中 ，sim 为 假 。 
根据 定理 2.21， 配 置 相 等 ， 这 表明 ， 所 要 求 的 对 sim 赋 值 是 不 可 能 的 。 

可 以 用 事件 集 和 这 些 事件 的 因果 序 刻 画 ~ 下 的 等 价 类 ; 称 等 价 类 为 算法 的 计算 。 

定义 2.22 称 分 布 式 算法 的 一 次 计算 为 算法 执行 的 等 价 类 ( ~ 下 )。 

谈论 一 次 计算 的 配置 毫 无 意义 ， 这 是 因为 不 同 的 计算 执行 可 能 会 产生 不 同 的 配置 。 因 此 
讨论 计算 的 事件 集 才 有 意义 ， 因 为 计算 的 所 有 执行 由 相同 事件 集 组 成 。 也 可 以 为 计算 定义 事 
件 因 果 序 。 如 果 执 行 是 有 限 的 ， 则 称 计算 是 有 限 的 。 如 果 计 算是 有 限 的 ， 开 始 于 同一 配置 
(参见 定理 2.21) 的 一 次 计算 的 所 有 执行 ， 则 会 终止 于 同 -- 配 置 ; 这 些 配置 称 为 计算 的 初始 配 
置 和 终止 配置 。 可 以 用 属于 它 的 事件 偏 序 集 来 确定 一 次 计算 。 

由 偏 序 理论 可 知 ， 对 于 一 次 计算 中 的 一 对 并 发 事件 ， 可 能 出 现任 意 次 序 。 

事实 2.23 hk (X, <) 是 偏 序 ， 且 a, DEX, BRD +* qa。 存在 < 的 一 个 线性 扩展 <|， 满 
Ra <,b, 

因此 ，、 如 果 a 和 4b 是 计算 C 中 的 并 发 事件 ， 则 存在 这 次 计算 的 执行 5 和 Es， 满足 a 在 E, 中 早 
于 b,b 在 6, 中 早 于 a。 执 行 中 的 进程 没有 任何 手段 来 决定 两 个 事件 的 哪 一 个 先 发 生 。 

1. 同步 消息 传递 ` 

定理 2.19 也 可 用 来 说 明 具 有 同步 消息 传递 的 系统 。 在 这 样 的 系统 中 ， 如 果 两 个 连续 事件 影 
响 不 同 的 进程 ， 则 这 两 个 事件 是 独立 的 。 如 以 下 定理 所 述 。 

定理 2.24 设 y 是 具有 同步 消息 传递 的 分 布 式 系统 的 配置 ，e1 是 进程 p 和 gq 的 一 次 转移 ，e， 
是 进程 -和 s (RA Fp. q) 的 一 次 转移 ， 满 足 el、e2 在 7 中 都 是 可 应 用 的 ， 那 么 ，ei 在 ex(y) 中 
是 可 应 用 的 ，ez 在 el(Y) 中 是 可 应 用 的 ， 并 且 ei(ei(y)) = ex(ei(y))。 

定理 的 证 明 ， 与 定理 2.19 的 证 明 方法 相同 ， 留 作 习题 2.9。 同 步 系 统 因果 关系 的 定义 类 似 
于 定义 2.20。 感 兴趣 的 读者 可 参见 [CBMT96]。 同 步 系统 也 有 和 定理 2.21 对 应 的 定理 。 

2. 执行 和 计算 

我 们 首先 定义 了 执行 (正如 转移 系统 的 运行 )， 然 后 引入 计算 作为 执行 的 等 价 类 。 这 个 次 
序 反 映 了 分 布 式 系统 中 所 发 生 的 可 操作 的 观点 。 许 多 其 他 的 著作 首先 引入 计算 作为 事件 上 的 
偏 序 集 ， 然 后 引入 执行 ， 作 为 这 些 集 的 线性 化 。 例 如 ，Charron-Bost et al[CBMT96] 在 标准 的 
消息 序列 图 的 形式 化 [RGG96] 中 就 是 这 样 做 的 。 这 两 种 方法 是 等 价 的 。 


2.3.3 逻辑 时 钟 
与 度量 真正 时 间 的 物理 时 钟 类 似 ， 在 分 布 式 计算 中 ， 可 将 时 钟 定义 成 表示 因果 关系 。 本 
节 中 ，6@ 表 示 有 序 集 (XK，<) 上 事件 的 函数 。 
定义 2.25 时 钟 是 有 序 集 (X, <) 上 事件 集 的 函数 日 ， 满 足 
a<b= O(a) < Q(b) 。 
在 本 节 的 其 余部 分 ， 讨 论 了 关于 时 钟 的 一 些 例子 。 


(1) 序列 中 的 次 序 在 一 次 执行 中 ， 定义 E 为 事件 序列 (eo, Eis €z, <), iO, (e) = io 
每 个 事件 用 它 在 事件 序列 中 的 位 置 进行 标号 。 
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可 用 此 函数 作为 系统 的 全 局 观察 器 ， 按 照 事 件 出 现 的 次 序 访问 事件 。 然 而 ， 在 系统 内 是 
不 可 能 观察 到 这 个 次 序 的 ， 换 句 话说， 一 个 分 布 式 算法 不 能 计算 出 89。。 这 是 定理 2.19 的 结 
论 ; 假设 某 些 分 布 式 算法 存储 了 事件 e 的 值 9s(e) = (满足 定理 的 前 提 条 件 )。 在 一 次 等 价 执 
行 中 ， 这 个 事件 与 下 一 事件 交换 ， 就 有 了 不 同 的 8。 值 ， 同 一 值 ;被 存储 在 进程 中 。 换 句 话说 ， 
Bs 是 定义 在 执行 上 ， 而 不 是 定义 在 计算 上 。 

(2) 实时 时 钟 ”可 对 此 模型 进行 扩充 ， 为 每 一 进程 提供 一 个 硬件 时 钟 这 是 本 章 的 主题 。 


用 这 种 方法 ， 可 记录 每 一 事件 发 生 的 真实 时 间 ; 所 得 的 数值 满足 时 钟 定义 。 


具有 实时 时 钟 的 分 布 式 系统 并 不 适合 于 定义 2.6。 因 为 时 钟 的 物理 性 质 与 不 同 进程 的 改变 
同步 。 时 间 在 所 有 进程 中 继续 着 ， 这 会 导致 转移 ， 这 种 转移 改变 所 有 进程 的 状态 (BN, ABP 
读数 ) 。 结 果 这 些 “ 全 局 转移 ”急剧 地 改变 了 模型 的 性 质 ; 事实 上， 如果 假 设 实 时 时 钟 ， 定 理 
2.19 就 不 再 成 立 。 然 而 ， 具 有 实时 时 钟 的 分 布 式 系 统 实 际 上 已 在 使 用 ， 它 们 将 在 本 书 第 3.2 节 ， 
第 12 章 和 第 15 章 中 进行 讨论 。 

(3) Lamporti’ #8} 4 ”Lamport[Lam78] 已 提出 一 个 时 钟 函数 ， 它 赋予 事件 a 长 度 E， 其 中 
《表示 最 长 事件 序列 的 长 度 (ei, ex). WEFTA: 


€,<e,<..<e, =a, 


的 确 ， 如 果 a <b， 扩 展 此 序列 可 得 ，B1 (a)< 8B,(b)。 可 计算 每 一 事件 的 8, 值 ， 通 过 基干 
下 列 关系 的 分 布 式 算法 计算 : 

a) 如 果 a 是 一 个 内 部 或 者 发 送 事件 ，a' 是 同一 进程 中 的 前 一 事件 ， 那 么 @.(a)=8Bi (a')+ 1。 

b) 如 果 a 是 一 个 接收 事件 ，a' 是 同一 进程 中 的 前 一 事件 ，b 是 与 4 对 应 的 发 送 事件 ， 那 么 
O, (a)= max(@,(a'), © L(b))+1. 

在 两 种 情况 下 ， 如 果 a 是 进程 的 第 一 个 事件 ， 则 假定 BL(a') 为 0。 

为 了 用 分 布 式 算法 计算 时 钟 值 ， 需 要 将 进程 p 的 最 后 一 个 事件 的 时 钟 值 存储 在 变量 @, 中 
(初始 化 为 0)。 为 了 计算 一 个 接收 事件 的 时 钟 值 ， 每 条 消息 m 包 含 事件 e 的 时 钟 值 8,， 且 在 事 
件 e 中 发 送 该 值 。 图 2-3 中 的 算法 给 出 了 Lamport 的 逻辑 时 钟 。 对 于 进程 p 中 的 事件 。，B1(e) 的 
值 就 是 紧 跟 在 e 之 后 的 @, 的 值 ， 即 进程 p 发 生 状 态 变化 的 时 刻 。 留 作 练习 证 明 ， 这 样 定义 的 6, 
是 时 钟 。 

还 未 明确 在 什么 条 件 下 ， 必 须发 送 消息 ， 进 程 的 状态 如 何 改变 。 时 钟 是 加 在 分 布 式 算法 
中 用 于 对 事件 定 序 的 一 种 辅助 机 制 。 

(4) 向 量 时 钟 “时钟 不 仅 能 够 表示 因果 序 (定义 2.25 所 要 求 的 ) 而 且 能 够 表示 并 发 性 。 如 
果 并 发 事件 用 无 法 比较 的 时 钟 值 标记 ， 则 用 时 钟 来 表示 并 发 性 。 即 定义 2.25 中 的 蕴含 用 等 价 
替代 ， 设 


a<b + @(a) < O(b) (2-1) 


并 发 事件 的 存在 表明 ， 这 样 的 时 钟 域 (RX) 是 一 个 非 全 序 集 。 
在 Mattern 的 向 量 时 钟 [Mat89b] 中 , X = N”, BO, (a) 是 长 为 N 的 向 量 。 长 为 4 的 向 量 自然 
地 按照 向 量 次 序 排列 ， 定 义 如 下 : 


(4),...54,) < (bisb,) > Vill< i< n):a, «<b, (2-2) 
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(向 量 序 不 同 于 习题 2.5 中 定义 的 字典 序 ; 后 者 是 全 序 。) 定义 时 钟 为 8,(a) = (a, ..., av), 
其 中 ，a; 是 进程 p, 中 满足 < a 的 事件 e 的 数目 。 正 像 Lamport 时 钟 一 样 ， 分 布 式 算法 可 以 计算 
出 这 个 函数 。 

Charron-Bost [CB89] 已 经 证 明 不 可 能 用 更 短 的 向 量 (如 式 (2-2) 中 所 定义 向 量 序 )。 如 果 将 
NN 个 进程 任意 一 次 执行 的 事件 映射 到 长 为 x 的 向 量 上 ， 并 满足 式 (2-1)， 那 么 n> N。 

var 0, : integer init 0; 
(* An internal event *) 


bp := Op +1; 
Change state 


(* A send event *) 


了 


(* A receive event *) 
receive (messg,6) ; bp := max(6p, 0) +1; 
Change state 





图 2-3 LAMPORT 的 逻辑 时 钟 算法 


2.4 附加 假设 ， 复 杂 度 


本 章 目前 所 作 的 定义 为 其 余 的 章节 打下 了 基础 。 所 定义 的 模型 为 算 靶 表示 和 验证 、 分 布 
式 问 题解 的 不 可 能 性 证 明 提 供 了 框架 。 在 后 续 章 节 中 ， 如 果 必 要 ， 可 以 附加 假设 和 使 用 符号 。 
本 节 讨 论 一 些 术语 ， 它 们 是 分 布 式 算法 文献 中 常用 的 。 


2.4.1 网 络 拓扑 结构 


到 目前 为 止 ， 我 们 用 当前 传输 中 的 消息 ， 对 分 布 式 系 统 的 通信 子 系统 进行 了 模拟 。 此 外 ， 
还 假设 每 一 消息 只 能 被 一 个 称 为 消息 目的 地 的 进程 接收 。 一 般 而 言 、 未 必 每 一 进程 都 能 够 发 
送 消 息 到 其 他 进程 。 而 是 ， 对 于 每 一 进程 ， 定 义 它 能 发 送 消息 的 其 他 进程 ( 称 为 进程 的 近邻 ) 
的 一 个 子 集 。 如 果 进 程 p 能 够 发 送 消息 到 进程 9， 则 称 从 p 到 gq 存在 信道 。 除 非 说 明 ， 否 则 假设 
信道 是 双向 的 ， 即 ， 在 同一 信道 上 ， 人 允许 进程 4 向 进程 p 发 送 消息 。 仅 允许 从 p 到 g 单 向 通信 的 
间 道 称 为 单 向 或 有 向 信道。 

进程 和 通信 子 系统 的 集合 也 称 为 网 络 。 通 信子 系统 的 结构 常常 用 图 G = (V, E) 表示 ， 图 
中 ， 节 点 表示 进程 ， 当 且 仅 当 两 进程 之 间 存 在 信道 ， 两 进程 之 间 存 在 边 。 可 以 把 单 向 信道 的 
系统 类 似 地 表示 成 有 向 图 。 分 布 式 系统 的 图 也 称 为 网 络 拓扑 结构 。 

表示 成 图 可 以 让 我 们 用 图 论 的 术语 讨论 通信 系统 ; 关于 术语 的 简介 参见 附录 B。 因 为 网 络 
拓扑 结构 对 许多 问题 的 分 布 式 算法 的 存在 性 、 外 观 、 复 杂 度 有 着 重要 影响 ， 以 下 简明 讨论 通 
常 所 用 的 拓扑 结构 ; 详情 参见 附录 B。 贯 穿 本 书 ， 除 非 有 特别 的 说 明 ， 都 假设 拓扑 结构 是 连通 
的 ， 即 任何 两 个 节点 之 间 存 在 路 径 。 

(1) 环 入 节点 的 环 (ring) 是 图 ， 有 节点 wm 到 ww 和 边 wws (下 标 模 N)。 由 于 其 简单 性 ， 
环 常用 于 分 布 式 控制 的 计算 中 。 同 时 ， 一 些 物理 网 络 ， 如 令 牌 环 (Token Ring)[Tan96， 参 见 
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4.3.3 节 ]， 也 按照 环 排列 节点 。 

(2) 树 N- 节 点 的 树 是 有 N-1 条 边 ， 且 不 包含 环 的 连通 图 。 在 分 布 式 计算 中 使 用 树 ， 是 因 
为 它 允 许 以 较 低 通信 开销 进行 计算 ， 此外， 每 一 连通 图 中 包含 树 作 为 生成 子 网 。 

(3) 星 NN- 节 点 的 星 有 一 特殊 节点 (中心 )，N-1 条 边 ， 将 N-1 个 节点 连 向 中 心 。 在 集中 
式 计算 中 使 用 星 形 连接 ， 其 中 一 个 进程 作为 控制 器 ， 其 余 进 程 只 与 该 特殊 进程 通信 。 星 型 拓 
站 结构 的 缺点 是 在 中 心 节 点 会 出 现 通 信 瓶 颈 和 系统 易 受 中 心 节点 发 生 的 故障 影响 。 

(4) 团团 是 一 个 网 络 ， 其 中 任意 两 节点 之 间 存 在 边 。 图 中 “ 隐 含 地 ”假设 ， 每 一 进程 
能 够 直接 地 与 其 他 进程 通信 。 参 见 第 13 章 和 第 16 章 。 i 

(5) BEAR 超 立 方 体 HCv = (V, E) 是 一 个 有 N = 2 个 节点 的 图 。 这 里 V 是 长 为 "的 二 
进 制 位 串 的 集合 : 

V = f(b- b,a): b; {0.1} , 


当 且 仅 当 位 串 b，c 只 在 其 中 某 一 位 不 同 ， 则 这 两 个 节点 2，c 之 间 有 一 条 边 相 连 。 超 立方 
体 的 名 字 指 的 是 将 网 络 图 示 成 4- 维 的 单位 立方 体 ， 立 方 体 的 顶点 即 为 节点 。 

这 些 网 络 的 例子 参见 图 2-4。 网 络 的 拓扑 结构 可 以 是 静态 的 也 可 以 是 动态 的 。 静 态 拓扑 结 
构 表示 ， 在 分 布 式 计算 过 程 中 二 扑 结构 保持 不 变 。 动 态 拓扑 结构 表示 ， 在 分 布 式 计算 过 程 中 ， 
可 以 添加 或 去 除 通道 (有 时 其 至 是 进程 )。 这 些 拓扑 结构 上 的 变化 可 以 通过 配置 的 转移 来 模拟 ， 

即 ， 是 否 进程 状态 反映 了 进程 的 近邻 集合 (参见 第 4 章 )。 





是 超 立 方 体 
图 2-4 通常 所 使 用 的 拓扑 结构 示例 
2.4.2 信道 性 质 


可 将 2.1.2 节 所 描述 的 模型 精细 化 ， 将 每 一 信道 的 内 容 分 别 表示 在 配置 中 ， 即 对 每 -- 单 向 
信道 hg 用 集合 集 Mw 末代 集合 M。 正 像 我 们 已 经 假定 的 那样 ， 每 一 消息 隐 含 地 定义 了 它 的 目的 
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地 ， 因 而 ， 这 样 的 修改 并 不 改变 模型 的 重要 性 质 。 下 面 ， 讨 论 对 发 送 和 接收 事件 通信 所 做 的 
假设 。 

(1) 可 靠 性 ” 称 信道 是 可 靠 的 ， 当 在 信道 中 所 发 送 的 每 一 消息 只 被 明确 地 接收 一 次 《〈 假 
定 目的 地 能 够 接收 消息 ) 时 。 除 非特 别 声明 ， 否 则 本 书 总 是 假定 ， 信 道 是 可 靠 的 。 这 种 假设 
实际 上 增加 了 (88) 公平 性 条 件 ; 的 确 ， 在 消息 发 出 之 后 ， 消 息 的 接收 方 是 可 应 用 的 。 

寺 道 的 不 可 靠 可 能 显现 为 通信 故障 ， 有 儿 种 类 型 的 故障 ， 例 如 ， 丢 失 、 混 淆 、 复 制 、 创 
建 。 通 过 2.6 节 定义 的 模型 ， 用 转移 代表 这 些 故障 。 

消息 的 丢失 发 生 在 所 发 送 的 消息 从 未 被 接收 ; 可 用 从 M 中 去 掉 消 息 的 一 次 转移 进行 模拟 。 
消息 的 混淆 (garble) 发 生 在 所 接收 的 消息 不 同 于 发 送 的 消息 的 时 候 。 它 可 通过 改变 M 中 一 条 
消息 的 转移 加 以 模拟 。 消 息 的 复制 出 现在 接收 的 消息 多 于 所 发 送 的 消息 。 它 可 通过 复制 M 中 
一 条 消息 的 转移 进行 模拟 。 消 息 的 创建 出 现在 当 消 息 被 接收 ， 而 从 未 发 送 过 该 消息 。 它 可 通 
过 在 M 中 插入 一 条 消息 的 转移 加 以 模拟 。 

(2) 先进 先 出 的 性 质 ” 称 信道 是 先进 先 出 (fifo) 的 ， 如 果 考 虑 所 发 送 消息 通过 信道 的 次 
序 。 即 ， 如 果 进 程 p 向 进程 q 发 送 两 条 消息 mi，m;， 并 且 在 p 中 以 ,的 发 送 早 于 m; 的 发 送 ， 那 么 在 
4 中 以 的 接收 早 于 m2 的 接收 。 除 非特 别 声 明 ， 本 书 将 不 假设 先进 先 出 信道 。 

在 定义 2.6 的 模型 中 ， 将 集合 M 用 一 组 队列 (queue) RE, ARENA, ， 每 个 信道 
一 个 队列 。 发 送 时 ， 将 消息 添加 到 此 队列 的 末尾 ， 接 收 事件 从 队列 头 删除 一 条 消息 。 当 假设 
先进 先 出 信道 时 ， 引 出 新 的 类 型 的 通信 故障 ， 即 消息 在 信道 中 重 排 。 它 可 通过 交换 队列 中 的 
两 条 消息 的 转移 进行 模拟 。 

有 时 分 布 式 算法 得 益 于 信道 的 先进 先 出 的 性 质 ; 参见 3.1 节 的 通信 协议 的 例子 。 利 用 消息 
接收 的 次 序 会 降低 每 次 消息 中 必须 传递 的 信息 量 。 然 而 ， 在 许多 情况 下 ， 即 使 消息 可 以 在 信 
道 重 排 ， 也 能 设计 算法 使 之 正常 (有 效 ) 运行 。 一 般 而 言 ， 在 分 布 式 系 统 中 实现 先进 先 出 的 
性 质 ， 可 以 降低 计算 的 固有 并 行 性 ， 因 为 在 消息 被 处 理 之 前 ， 它 需要 消息 缓冲 。 因 此 ， 本 书 
并 不 隐 含 的 假设 先进 先 出 的 性 质 。 

Ahuja[Ahu90] 提 出 了 弱 假 设 ; 清仓 信道 (flush channel) 仅 考 虑 发 送 方 所 确定 的 消息 次 序 。 
Schiper 等 人 [SES89] 定 义 了 因果 次 序 的 消息 传输 如 下 。 如 果 p;、p; 向 事件 e/ 和 es 中 的 进程 q 发 送 
Fim Alm, Her < e2， 那 么 gq 在 ms 之 前 接 到 m,。 传 输 假设 的 层次 性 由 完全 异步 性 、 因 果 次 
序 的 传输 、 先 进 先 出 、 同 步 遂 信 和 构成， 参见 Charron-Bost 等 人 [CBMT96] 的 讨论 。 _ 

(3) 信道 容量 ”同时 在 信道 中 传输 的 消息 数 定义 为 信道 容量 (channel capacity )。 当 信道 
中 包含 的 消息 等 于 信道 的 容量 时 ， 信 道 是 满 的 。 仅 当 信 道 不 满 时 ， 发 送 事 件 是 可 应 用 的 。 

定义 2.6 给 出 了 无 限 容量 信道 的 模型 ， 即 信道 永远 不 会 满 。 本 书 总 是 很 设 信道 容量 是 无 限 
的 。 


2.4.3 实时 性 假设 


分 布 性 是 所 提出 模型 的 本 质 特 征 : 不 同 进程 中 事件 的 完全 独立 性 ， 如 定理 2.19 中 所 表示 
的 那样 。 当 假设 全 局 时 间 帧 和 进程 观察 物理 时 间 的 能 力 (物理 时 钟 设备 ) 时 ， 就 会 失去 这 -… 
性 质 。 当 某 实 时 时 间 扫 过 时 ， 这 个 时 间 会 扫 过 所 有 进程 ， 这 个 过 程 出 现在 每 一 进程 的 时 钟 
中 。 

通过 为 每 个 进程 配备 实时 时 钟 变量 可 以 将 实时 时 钟 结合 进来 ; 通过 取出 进程 时 钟 的 转移 





可 以 模拟 实时 扫 过 时 间 ; 参见 3.2 节 。 通 常 ， 结 合 实时 时 钟 可 用 性 ， 假 设 消息 的 传输 时 间 ( 消 
息 发 送 与 接收 之 间 的 时 间 ) 有 限 。 这 个 界限 可 以 包含 在 通用 转移 系统 模型 中 。 

除非 说 明 本 书 对 于 实时 性 不 做 一 般 性 的 假设 ;我 们 考虑 完全 异步 的 系统 和 算法 。 在 3.2 节 、 
第 12 章 和 第 15 章 会 用 到 实时 性 的 假设 。 


2.4.4 进程 知识 


初始 进程 的 知识 是 指 分 布 式 系统 中 的 信息 ， 用 进程 的 初始 状态 表示 。 如 果 某 一 算法 声称 
依赖 于 这 种 信息 ， 则 它 假设 了 在 系统 开始 执行 之 前 ， 有 关 的 信息 已 经 正确 地 存储 在 进程 中 。 
具有 这 种 知识 的 例子 含有 以 下 信息 。 

(1) 拓扑 信息 ”拓扑 信息 包括 : 进程 数 、 网 络 图 直径 和 图 的 拓扑 结构 。 如 果 对 于 ， 进 程 
图 中 带 有 方向 的 一 致 标签 边 是 为 进程 所 知 的 (参见 附录 B ) ， 则 称 网 络 有 方向 债 听 (sense of 
direction). 

(2) 进程 标识 ”很 多 算法 要 求 进程 有 惟一 的 名 字 (标识 ) ， 初 始 时 ， 每 一 进程 知道 自己 的 
名 字 。 假 定 进程 包含 一 个 变量 ， 初 始 化 为 进程 名 ( 即 ， 每 一 进程 有 不 同 的 名 字 )。 可 对 选择 名 
字 的 集合 做 进一步 假设 。 例 如 ， 名 字 是 线性 有 序 ， 或 者 它们 是 〈 正 ) 整数 。 

除非 说 明 ， 本 书 总 是 假设 进程 可 以 访问 它们 的 标识 ; 在 这 种 情况 下 ， 称 系统 为 命名 网 络 
(named network )。 非 此 种 情况 ， 称 为 匿名 网 络 (anonymous network ) ， 将 在 第 9 章 中 讨论 。 

(3) 近邻 标识 ”如 果 用 惟一 名 字 区 分 进程 ， 可 假设 每 一 进程 初始 时 知道 它 近邻 的 名 字 。 
这 种 假设 称 为 近邻 知识 (neighbor knowledge )， 一 般 不 做 此 假设 。 进 程 名 对 消息 定 址 有 用 ; 
当 用 直接 定 址 (direct addressing) 法 来 发 送 消息 时 ， 给 定 了 消息 的 目的 地 名 。 一 个 更 强 的 假 
设 是 ， 每 一 进程 知道 整个 进程 名 的 集合 。 

弱 的 假设 是 ， 进 程 只 知道 其 近邻 存在 ， 但 并 不 知道 名 字 。 在 这 种 情况 下 ， 不 能 利用 直接 
定 址 法 ， 当 为 消息 定 址 时 ， 进 程 利用 信道 的 局 部 名 字 ， 这 称 为 是 间接 定 址 (indirect 
addressing) 法 [SK87，P.54] 。 直 接 定 址 和 间接 定 址 法 如 图 2-5 所 示 。 直 接 定 址 法 利用 进程 标识 
作为 地 址 ， 而 在 间接 定 址 法 中 ， 进 程 p、r 和 xs 用 不 同 的 名 字 (分 别 为 <、b 和 c) 为 带 有 目的 地 5 


的 消息 定 址 。 
CO) © QQ 


D OS 


a) 直接 定 址 b) 间接 定 址 
图 2-5 


2.4.5 分 布 式 算法 的 复杂 度 
正确 性 是 分 布 式 算法 最 重要 的 性 质 ， 必须 满足 算法 对 要 解决 的 问题 所 提出 的 要 求 。 为 比 
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较 同一 问题 的 不 同 算法 ， 有 必要 对 算法 所 消耗 的 资源 进行 度量 。 消 耗 越 低 ， 算 革 越 “好 ”。 可 
用 以 下 方法 度量 分 布 式 算法 所 消耗 的 资源 。 

(1) 消息 复杂 度 算法 中 所 交换 的 消息 总 数 。 

(2) 位 复杂 度 ”因为 集合 M 通常 包含 不 同 的 消息 ， 每 条 消息 必须 传输 的 信息 的 数量 
ALM 标识 。 对 于 利用 集合 的 一 个 算法 ， 若 集合 M 较 小 ， 每 条 消息 只 能 用 少量 的 位 来 标 
识 ， 而 使 用 许多 不 同 消息 的 算法 在 每 条 消息 中 需要 更 多 位 来 标识 。 因 为 传输 “长 ”消息 比 
“ 短 ” 消 息 开销 大 ， 因 此 也 可 以 计算 消息 中 所 包含 的 总 位 数 。 

本 书 中 的 大 多 数 算法 ， 使 用 包含 0(logN) 位 的 消息 (其 中 是 进程 数 )。 因 此 ， 它 们 的 位 
复杂 度 超过 了 消息 复杂 度 一 个 对 数 因子 。 在 大 多 数 情况 下 ， 只 分 析 算法 的 消息 复杂 度 。 只 有 
在 利用 很 长 或 很 短 的 消息 时 ， 才 分 析 算法 的 位 复杂 度 。 

(3) 时 间 复杂 度 。 如果 分 布 式 算法 模型 中 没有 包含 时 间 概 念 ， 定 义 分 布 式 算法 的 复杂 度 
就 不 那么 显而易见 。 在 文献 中 (参见 6.4 节 ， 作 为 比较 ) ， 可 以 找到 不 同 的 复杂 度 的 定义 。 & [0 
书 的 定义 基于 计算 中 事件 的 理想 时 间 ， 按 照 以 下 假设 。 70 

(a) 处 理 一 个 事件 的 时 间 为 0 时 间 单位 。 

(b) 传输 时 间 ( 即 ， 发 送 和 接收 一 条 消息 之 间 的 时 间 ) 最 多 为 一 个 时 间 单位 。 

在 这 些 假设 之 下 ,算法 的 时 间 复杂 度 是 计算 所 消耗 的 时 间 。 注 意 此 假设 仅 适合 于 定义 算 
法 的 时 间 复杂 度 。 异 步 算法 正确 性 的 证 明 必 须 独立 于 这 些 假设 。 

(4) 空间 复杂 度 ”算法 的 空间 复杂 度 等 于 执行 算法 的 进程 所 需 存储 量 的 大 小 。 进 程 所 需 
9 空间 是 进程 状态 数 的 对 数 。 

由 于 分 布 式 算法 的 操作 是 不 确定 性 的 ， 算 法 可 能 产生 多 种 计算 ， 对 于 这 些 计算 ， 度 量 可 
能 是 不 相等 的 。 因 此 产生 最 坏 情况 复杂 度 和 平均 情况 复杂 度 的 区 别 。 最 坏 情况 的 复杂 度 是 算 
法 的 最 大 计算 复杂 度 。 平 均 情况 复杂 度 是 算法 中 所 有 可 能 计算 的 平均 值 ， 需 定义 所 有 计算 上 
的 概率 分 布 。 


习题 


2.1 节 
2.1 定义 一 个 分 布 式 系统 模型 ， 其 支持 同步 和 异步 消息 传输 。 
2.2 节 
下 列 三 个 练习 研究 不 变 式 和 总 是 为 真 谓词 的 差异 ， 研究 不 变 式 的 析 取 与 合 取 及 其 导出 式 ， 
以 及 并 行程 序 组 合 的 不 变 式 的 行为 。 
2.2 给 出 一 个 转移 系统 S 和 断言 已 ， 满 足 已 在 8 中 总 是 为 真 ， 但 不 是 8 的 不 变 式 。 
(提示 : 在 文献 [GT90] 中 ， 给 出 了 具有 三 种 配置 的 一 个 例子 。 能 找 出 具有 两 种 配置 的 一 个 
例子 吗 ? ) 
2.3 RRP), PRARRSHREX, 证 明 (P, V Pi) 和 (PLAP) 是 不 变 式 。 
RP. P RASH- kt, 证明 (Pi V Pi) 和 (P, A P) RAKSHO-F EH, 
有 具有 同一 配置 集 和 初始 配置 集 的 转移 系统 可 通过 将 其 转移 关系 组 合 而 成 。 因 此 S， = (Cc, 
->i T) 5S, = (C, >, T) 的 并 行 组 合 是 系统 5 = (C, >, T ) ， 其 中 一 = (>, U =>). 
2.4 RSAS FS, 的 并 行 组 合 。 证 明 ， 如 果 P 是 SI 和 5, 的 不 变 式 ， 那么 P 是 8 的 不 变 式 。 证 
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明 ， 如 果 忆 是 8 和 8 的 @- 导 出 的 ， 那 么 PP 是 3 的 @- 导 出 的 。 给 出 一 个 实例 ， 使 得 忆 在 8 和 8Sz 总 是 
为 真 ， 在 3 中 却 不 是 。 

下 个 练习 关注 良 基 集 。 即 在 集合 中 有 一 个 元 素 ， 存 在 集合 中 的 无 限 多 个 元 素 大 于 它 ， 这 
个 集合 可 为 良 基 和 的。 向 量 a = (ao，a，…，a) Alb = (bo, bi, +, bn) 字典 序 由 以 下 关系 定 
义 。 


n 


2.5 证 明 (N", <) (其 中 n>2) 存在 多 个 元 素 ， 小 于 集合 中 的 无 限 多 个 元 素 。 
证 明 (N°, <) 是 良 基 的 。 


a<,b ea <b v(a, =b, A{a av,]<， (b,,...,b )) 


2.3% 


2.6 sea merta- p EARE, m A d Lamportig 4 t e , 

对 带 有 时 钟 值 的 事件 加 标签 ， 时 钟 值 由 Mattern 向 量 时 钟 给 出 。 

区 分 并 发 事件 对 ， 并 检查 赋 给 这 些 事件 的 标签 是 否 为 有 序 的 。 

2.7 给 出 一 个 分 布 式 算法 〈 与 图 2-3 中 的 算法 类 似 )， 它 可 对 带 有 时 钟 值 的 事件 加 标签 ， 


时 钟 值 由 Mattern 向 量 时 钟 给 出 。 
2.8 你 能 反复 将 定理 2.19 应 用 到 EE 的 事件 中 ， 来 证 明定 理 2.21 吗 ? 
2.9 证 明定 理 2.24。 


2.10 定义 具有 同步 通信 的 系统 的 转移 因果 序 。 并 为 此 系统 定义 时 钟 。 给 出 计算 时 钟 的 分 
布 式 算法 。 
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本 章 讨论 两 个 协议 ， 它 们 可 用 于 两 计算 站 点 间 可 靠 的 数据 交换 。 在 理想 情况 下 ， 只 需 通 
过 发 送 消息 和 接收 消息 即 可 交换 数据 。 然 而 令 人 遗憾 的 是 ， 不 是 总 能 够 忽略 通信 出 错 的 可 能 
性 ;消息 经 过 物理 介质 传输 时 ， 可 能 丢失 、 复 制 、 重 排 或 者 混淆 。 必 须 检测 出 这 些 错误 ， 并 
通过 辅助 机 制 加 以 纠正 。 在 传统 上 ， 这 些 机 制 称 为 协议 ， 在 计算 站 点 中 实现 。 

这 些 协议 的 主要 功能 是 数据 传输 ， 即 在 一 个 站 点 上 接收 信息 ， 在 另 一 个 站 点 上 发 送信 息 。 
可 靠 的 数据 传输 包括 反复 发 送 丢 失 的 消息 、 拒 绝 或 纠正 混淆 的 消息 和 丢弃 复制 的 消息 。 为 此 ， 
协议 维护 状态 信息 ， 这 些 信息 记录 着 哪些 数据 已 发 送 ， 哪 些 数据 已 证 实 接 收 等 等 。 利 用 状态 
信息 的 必要 性 引出 了 连接 管理 问题 ， 即 状态 信息 的 初始 化 和 丢弃 。 称 初始 化 为 打开 (opening) 
一 个 连接 ， 称 丢弃 为 关闭 (closing) 一 个 连接 。 连 接管 理 的 困难 在 于 当 关 闭 连接 时 ， 消 息 仍 
然 有 可 能 留 在 信道 中 。 当 不 存在 连接 或 者 在 后 一 次 连接 的 过 程 中 ， 这 样 的 消息 仍 可 被 接收 ， 
并 且 它 的 接收 必须 不 影响 当前 连接 的 正常 操作 。 

按照 协议 的 层次 ， 本 章 所 讨论 的 协议 适用 于 不 同 的 层 ， 例 如 ，OSI 参 考 模型 (1.2.2 节 )。 
它们 被 包括 在 本 书 中 是 由 于 多 种 原因 ; 第 一 个 协议 是 完全 异步 的 ， 第 二 个 协议 要 靠 正确 地 使 
用 计时 器 。 在 两 种 情形 下 ， 对 协议 的 验证 集中 在 所 需要 的 安全 性 方面 ， 即 , -接收 方 只 发 送 正 
确 的 数据 。 

第 一 个 协议 〈3.1 节 ) 是 为 两 个 站 点 之 间 进 行 数据 交换 而 设计 的 ， 两 站 点 之 间 有 直接 的 物 

理 连 接 (如 ， 电 话 线 )， 因 此 属于 OSI 模型 的 数据 链 路 层 。 第 二 个 协议 (3.20) 是 为 必须 通过 
中 间 网 络 《〈《 可 能 包含 其 他 站 点 ， 并 经 过 不 同 路 径 连接 到 结束 站 点 ) 进行 通信 的 两 站 点 设计 的 。 
因此 ， 这 个 协议 属于 OSI 模型 的 传输 层 。 这 种 差异 影响 着 协议 所 要 求 的 功能 ， 体 现在 以 下 两 方 
面 。 
(1) 差错 考虑 ”对 于 这 两 个 协议 ， 考 虑 不 同类 型 的 传输 错误 。 在 一 个 物理 连接 中 ， 消 息 
不 能 相互 经 过 旁 路 ， 也 不 能 被 复制 ;在 3.1 节 ， 只 考虑 消息 丢失 的 情况 〈 对 于 消息 的 混淆 ， 参 
见 下 面 )。 在 网 络 中 ， 由 于 消息 可 沿 不 同 路 径 行进 ， 因 此 ， 相 互 可 经 过 旁 路 ; 同时， 由 于 中 间 
站 点 的 故障 ， 消 息 不 仅 可 能 丢失 而 且 可 能 复制 。 因 此 ， 在 3.2 节 ， 讨 论 消息 的 丢失 、 复 制 和 重 
定 序 问题 。 

(2) 连接 管理 ”在 第 一 个 协议 中 ， 将 不 考虑 连接 管理 ， 但 在 第 二 个 协议 中 要 考 虚 。 通 党 
假设 物理 连接 可 持续 操作 很 长 一 段 时 间 ， 而 不 是 反复 打开 和 关闭 连接 。 这 不 是 与 远程 站 点 连 
接 的 情况 。 这 样 的 连接 可 能 是 暂时 地 用 于 交换 一 些 数据 ， 但 是 由 于 开销 太 大 ， 不 能 不 确定 地 
维持 与 每 个 远程 站 点 的 连接 。 因 此 ， 在 第 二 个 协议 中 ， 需 要 具有 打开 和 关闭 连接 的 能 力 。 

第 一 个 协议 表明 ， 要 达到 数据 传输 协议 所 要 求 的 安全 性 ， 基 于 计时 器 的 机 制 不 是 主要 问 
题 。 根 据 2.2 节 描述 的 证 明 方法 ，3.1 节 给 出 了 第 一 个 大 的 安全 性 证 明 的 例子 。 普 遍 认为 
[Wat81]， 计 时 器 的 正确 使 用 和 对 消息 传输 中 的 时 间 限 制 对 安全 连接 管理 是 必要 的 。 因 此 ， 为 
了 证 明 连 接管 理 协议 的 安全 性 ， 必 须 考 虑 计时 器 的 作用 。3.2 节 表明 ， 分 布 式 系 统 (定义 2.6) 
的 模型 是 如 何 被 扩展 到 使 用 计时 器 的 进程 中 ， 并 提供 了 此 扩展 的 一 个 例子 。 
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消息 混淆 

考虑 消息 在 传输 过 程 中 混 诡 的 可 能 性 是 现实 的 。 由 于 环境 噪声 、 存 储 单元 故障 等 因素 ， 
可 能 造成 通过 物理 连接 进行 通信 的 消息 遭 到 破坏 。 然 而 ， 假 设 接收 进程 可 以 检测 出 消息 混淆 ， 
例如 ， 通 过 奇偶 校 验 或 者 更 一 般 的 校 验 和 机 制 (参见 [Tan96， 第 3 章 ])。 对 于 收 到 的 混 消 消息 ， 
处 理 起 来 就 好 像 没有 接 到 消息 ， 因 而 消息 混淆 事实 上 导致 消息 丢失 。 因 此 、 并 不 明确 处 理 消 
息 的 混淆 ; 而 总 是 考虑 消息 丢失 的 可 能 性 。 


3.1 平衡 滑动 窗口 协议 


本 节 了 研究 了 可 靠 的 双向 信息 发 送 对 称 协议 。 这 一 协议 取 自 [Sch91， 第 2 章 ]。 因 为 它 用 于 有 
直接 连 线 的 节点 的 信息 交换 ， 因 此 假设 信道 有 先进 先 出 的 性 质 。 这 个 假设 直到 3.1.3 节 才 用 ， 
在 假设 中 ， 对 协议 所 用 的 序列 号 进行 了 限制 。3.1.1 节 给 出 了 该 协议 ，3.1.2 节 证 明了 它 的 正确 
性 。 

用 p、4 表 示 两 个 通信 进程 。 假 设 、 要 求 和 协议 关于 p、4 是 完全 对 称 的 。p 的 输入 是 由 必须 
发 送 给 4 的 信息 组 成 ， 用 无 限 大 的 字数 组 im 模型 化 。p 的 输出 由 接收 4 的 信息 组 成 ， 也 用 无 限 大 
的 字数 组 outs 模 型 化 。 暂 时 假设 p 能 对 数组 in, 随 机 读 ， 对 数组 out 随 机 写 。 初 始 时 ，out,[i] 值 未 
定义 ， 用 udef 表 示 。 进 程 9 的 输入 和 输出 分 别 用 in,、outs 进 行 模型 化 。 这 些 数组 的 下 标 为 自然 
数 ， 从 0 开始 。3.1.3 节 表明 ， 对 于 数组 的 随机 访问 ， 可 以 限制 到 访问 具有 有 限 长 度 的 “窗口 ” 
上 ， 窗 口 在 数组 上 滑动 。 这 就 是 为 什么 称 此 协议 为 “滑动 窗口 ”协议 。 

进程 p 包 含 一 个 变量 w， 表 明 pP 期 望 从 4 接收 的 最 小 的 有 限 字 。 因 此 ， 在 任意 时 刻 ，p 已 经 写 
人 outr[0] 到 outpp[so- 世 。sz 的 值 永 不 递减 。 类 似 地 ， 进 程 9 包含 一 个 变量 *,。 现 在 阐述 协议 所 要 求 
的 性 质 。 安 全 性 指 的 是 ， 每 一 进程 仅 输出 正确 的 数据 ; 活动 性 指 的 是 ， 所 有 数据 最 终 被 发 送 。 

(1) 安全 发 送 在 协议 的 每 一 个 可 达 配 置 中 ， 


out,[0..s, -1]- in,[0.s, - 1] H out,[0.s, 一 i]- in [0.5 - 1] 
(2) 最 终 发 送 对 每 一 整数 :>0， 最 终 达 到 配置 ， ARAM BI As, > k 和 ss > k 
3.1.1 HREF 


传输 协议 通常 依赖 于 确认 消息 的 使 用 。 接收 进程 发 送 确认 消息 ， 通 知 发 送 方 数 据 已 经 正 
确 接 收 。 如 果 数 据 的 发 送 方 没 有 接 到 确认 ， 它 就 假定 数据 消息 (RMU) 丢失 ， 并 重 发 数据 。 
然而 ， 在 本 节 的 协议 中 ， 没 有 使 用 明确 的 确认 消息 。 该 协议 中 两 个 站 点 都 可 以 向 另 一 方 发 送 
消息 ; 站 点 的 消息 也 可 用 作对 另 一 站 点 消息 的 确认 。 

进程 交换 的 消息 称 作 包 ， 它 们 具有 形式 <pack ，w，i>， 其 中 w 是 数据 字 ， i 是 自然 数 ( 称 
为 包 的 序列 号 )。 当 p 把 该 包 向 g 发 送 时 ， 传 输 字 w = in,Li). 同时 正如 前 面 所 述 ， 对 4 所 接收 包 
的 序列 号 进行 确认 。 如 果 假 定 进程 p 所 发 送 的 数据 包 <pack，w， i> qe 7 0.i-L A=, 
进程 就 可 以 是 4“ 前 ”固定 数目 5 个 包 。( 进 程 9 发 送 时 ， 包 的 含义 是 类 似 的 。) BU, FNL AE AE 
负 的 ， 且 为 进程 p、4 所 知 。 对 于 协议 的 转移 ， 作为 确认 消息 的 数据 包含 有 两 方面 的 意义 : 

(1) 仅 当 存储 oui,[0] 至 outs[i-,] 的 所 有 字 之 后 ， 即 ， 如 果 i < s, + !,， 进 程 p 才 可 以 发 送 字 
ingli] (正如 包 <pack, in,[i], i>). 

(2) 当 p 接 收 <pack，w，i 认 ， 不 再 需要 重新 传输 从 inb[0] 到 in,[i-1,] 的 字 。 
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1. 伪 代 码 的 解释 
在 做 了 这 些 设 计 选择 之 后 ， 不 难 给 出 协议 的 代码 ;参见 图 3-1 中 的 算法 。 将 变量 4,、as 分 
别 引 入 进程 p?。、gq 中 ， 表 示 p、4q 分 别 还 未 收 到 确认 时 ， 编 号 最 小 的 字 。 


在 图 3-1 的 算法 中 ,行为 S, 表 示 p 所 发 送 的 第 i 个 字 ， 行 为 R, 表 示 p 所 接收 的 一 个 字 ， 行 为 L。 
表示 目的 地 为 p 的 包 丢 失 。 进 程 p 可 以 发 送 下 标 位 于 上 述 所 列 范围 的 任意 字 。 当 接收 到 消息 时 ， 
首先 做 校 验 ， 是 否 接 到 相同 的 消息 (以 防 是 重 传 )。 如 果 不 是 相同 消息 ， 则 将 所 包含 的 字 写 人 
输出 ， 并 更 新 a, 和 s, 。 当 P，4 颠 倒 时 ， 也 会 有 行为 S,、Re 和 L, 。 

2. 协议 的 不 变 式 

可 用 两 队列 来 表示 通信 子 系统 。@v 表 示 目 的 地 为 p 的 包 。@ 表 示 目 的 地 为 9 的 包 。 可 以 看 
出 R, 中 s 的 更 新 计算 ， 从 不 会 计算 出 比 以 前 小 的 值 ， 因 此 ，s%p 从 不 递减 。 为 了 证 明 算 法 满足 早 
先 给 定 的 要 求 ， 首 先 要 证 明 ， 断 言 P 是 不 变 式 。( 在 本 断言 和 其 他 断言 中 ， 十 自然 数 。) 


Ps Vi<s, out, [i] *udef (Op) 
A Wi<s,: out, [i] #udef (0q) 
A <pack, w, > EQ, > we=in,{i] A (i<s,+1,) (1p) 
A <pack, w, i>€Q, >we=in,[i] A (i<s,+],) (1q) 
A out, [i] + udef = out,[i] = infi] A (a,>i-1,) (2p) 
A Outsli] + udef = out li] = in,[i] A (a,>i-1,) (2q) 
A ap S Sq (3p) 
AN a, SS, (3q) 


引 理 3.1 P 是 图 3-1 中 的 算法 的 不 变 式 。 
证 明 。 在 每 个 初始 配置 中 ，Q,、Qs 都 为 空 ， 对 所 有 i，out, [iout [ 门 为 udef，a,、as、s,、 
354 置 为 0; 这 些 曾 含 着 P 为 真 。 现 在 依次 考虑 协议 的 转移 ， 以 证 明 在 转移 中 P 保 持 性 质 。 首 先 注 
BB, in, Min WEARS. 

S,: 为 证 明 S, 保 持 式 (0p)，、 观 察 可 得 S, 不 增加 s,， 也 不 会 使 out, [i] 等 于 udef。 
为 证 明 5, 保 持 式 (0q)， 观 察 可 得 S, 不 增加 s。， 也 不 会 使 outy 四 等 于 udef。 
为 证 明 S 保 持 式 (1p). 观察 可 得 S, 不 增加 Cu 的 包 ， 也 不 会 使 "下 降 。 
为 证 明 S, 保 持 式 (19)， 观 察 可 得 5, 为 ,增加 <pack,，w, i>， 目 w = in, [i] 和 i < s, + lp, 
而 保持 s, 值 不 变 。 
为 证 明 S, 保 持 式 (2p) 和 式 (2q)， 观 察 可 得 S, 不 改变 out,、out,、as 或 a, 的 值 。 
为 证 明 S, 保 持 式 (3p) 和 式 (3q), 观察 可 得 S, 不 改变 a,、a,、ss 或 ,的 值 。 

R,: 为 证 明 R, 保 持 式 (0p)， 观 察 可 得 R, 不 会 使 out, [i] 等 于 udef， 如 果 它 重新 计算 s,， 也 
WEA (Op). 
为 证 明了 Rn 保持 式 (0q)， 观 察 可 得 R, 不 改变 outs 或 5,。 
为 证 明 R, 保 持 式 (1p)， 观 察 可 得 R, 不 增加 Q, 的 包 ， 也 不 会 使 ss 下 降 。 
为 证 明 R, 保 持 式 (1q)， 观 察 可 得 R, 不 增加 Q, 的 包 ， 也 不 会 使 ;, 下 降 。 
为 证 明 R, 保 持 式 《2p)， 观 察 可 得 R, 一 旦 接 到 <pack，w，i>， 就 将 out, [站 改 为 wv。 因 
ERRAZA. OBALU, R (Op) 蕴含 w = im 中。 赋值 语句 av := max(a,, i-l 
+1) 保 证 应 用 之 后 a, > i- R. 
为 证 明 R, 保 持 式 (2q)， 观 察 可 得 RR, 不 改变 outs 或 a 的 值 。 
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为 证 明 R, 保 持 式 (3p)， 观 察 可 得 当 R, 执 行 赋值 语句 4, := max (a,，i-lst1) (一 旦 接 
Zil<pack, w, i>), X (1p) Si < s, + l,。 因 此 赋值 语 甸 执行 后 ，ap< ss 成 立 。R， 
不 改变 sy。 
为 证 明 RR, 保 持 式 (3q)， 观 察 可 得 ，s, 只 能 在 R, 的 应 用 中 增加 。 
L,: 为 证 明 L" 保 持 式 (0p)、 式 (0q)、 式 (2p). A (2q)、 式 (3p) 和 式 (3q), 观察 可 
得 L, 不 改变 进程 的 任何 状态 就 足够 了 。 因 为 L, 仅 删除 包 (并 不 插入 和 混 诡 它们 )， 因 
此 它 保持 式 (1p) AA (1q)。 
按照 对 称 性 ，S,、R, 和 L ,保持 忆 。 






















var Sp, âp : integer init 0, 0; 
inp : array of word (* Data to be sent *) ; 
outp : array of word init udef, udef,... ; 





Sp: {a <i<s+h} 
begin send Y pack, inpli}, i) to g end 


Ry: { (pack, w,i) € Qp } 
begin receive ( pack, w,i) ; 
if outpli] = udef then 
begin out,[¢] := w ; 
ap :一 Max (ap ey 
Sp := min {j| outy[j] = udef} 
end 


(* else ignore, packet was retransmission *) 











end 


Lp: { (pack, w,i) € Qp } 
begin Qp := Q, \ {( pack, w,i)} end 










图 3-1 平衡 滑动 窗口 协议 (进程 p) 算法 


3.1.2 协议 的 正确 性 证 明 


现在 证 明 图 3-1 所 示 的 算法 能 确保 安全 性 并 最 终 发 送 。 安 全 性 隐 含 在 不 变 式 中 ,如 定理 3.2， 
但 是 活动 性 的 证 明 有 点 难 。 

定理 3.2 图 3-1 所 示 的 算法 满足 安全 发 送 的 要 求 。 

证 明 。 式 (0p) MK (2p) Bout, (0..s,~1] = ing [0..s,-1], X (0q) MÈ (2q) BS 

out, [0..s, ~1] = in, [0..s, -1]. 口 

为 证 明 协 议 的 活动 性 ， 有 必要 做 关于 公平 性 的 假设 ， ART LBR. ERA 
些 假设 ， 协 议 不 能 满足 活动 性 要 求 ， 正 如 在 下 面 的 证 明 中 所 见 。 由 于 非 负 常数 /,、i, 未 定 ; 如 
果 它 们 为 0， 则 在 初始 配置 (每 一 初始 配置 是 终止 配置 ) 中 ， 协 议 死 锁 。 因此 假设 1,+ls > 0。 

协议 的 配置 可 表示 为 y = (c,，c。，Q,，Q,)， 其 中 c,、cs 是 p、g 的 状态 。 设 y 是 一 个 配置 ， 
其 中 $, 是 可 应 用 的 (对 某 些 i)。 设 


5=S,(1)=(¢,.¢,,0,(2, U{m)) 


注意 ,Ls 在 6 中 是 可 应 用 的 。 如 果 Ls 去 除 n， 则 LL,( 6) =y RAKL,(S,(y))= y 引 起 无 限 
计算 ， 既 不 增加 s,， 也 不 增加 s。。 
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如 果 满 足下 面 的 两 个 公平 性 假设 ， 则 协议 满足 最 终 发 送 要 求 。 

Fl 对 于 无 限 长 的 时 间 、 如 果 包 的 发 送 是 可 应 用 的 ， 则 可 无 限 多 次 地 发 送 包 。 

F 如 果 同 一 包 可 发 送 无 限 多 次 ， 则 它 可 无 限 多 次 被 接收 。 

假设 51 保证 ， 如 果 没 有 接 到 确认 ， .可 反复 的 再 次 重 发 包 ; F2 排 除 了 重 发 从 未 接收 的 情况 。 

这 两 个 进程 都 不 能 一 个 在 男 一 个 之 前 太 多 ，sp 和 s* 之 间 的 差距 应 保持 有 限 。 这 就 是 为 什么 

协议 称 之 为 平衡 协议 ， 它 表明 ， 如 果 满 足 9 最 终 发 送 的 要 求 ， 那 么 它 也 满足 "的 要 求 。 反 之 亦 
然 。 它 还 表明 ， 该 协议 不 能 用 于 一 个 进程 所 发 送 的 字 多 于 另 一 个 进程 时 的 情况 。 

引 理 3.3 PSs, -ls < a, < so atl, S stl, 

证 明 。 由 式 (Op) 和 式 (2p) Ti, s-h <a R AK (3p) 可 得 ，a < s。。 由 式 
(0q) 和 式 (2q) HI, s4 < at R FAX (3q) 可 得 ay + 1,< Ssp +l, RI. 口 

定理 3.4 图 3-1 所 示 的 算法 满足 最 终 发 送 要 求 。 

证 明 。 首 先 证 明 ， 协 议 不 可 能 死 锁 。 不 变 式 蕴含 着 ， 两 个 进程 之 一 能 够 发 送 包 含 最 小 编 
导 字 的 包 ， 该 包 还 是 另 一 进程 所 缺少 的 。 口 

南明 3.5 PHAM, pty Rik<pack, in,[s,], s,>, A494 Kix<pack, in,[s,], s, > 都 是 
可 应 用 的 。 

te, FFI, +1,>0, 在 引 理 3.3 中 ， 至 少 有 一 个 是 严格 不 等 式 ， 也 就 是 ， 

5,<5, +1, v5, <5, 41, o 
Phe, a,<s,(3p) Ha,<s, (39)， 由 此 得 出 ， 
(a, < 5, <s, +1,)v(a, <5, <5,+1,, 

即 ， 对 于 i = 99，$, 是 可 应 用 的 ， 或 者 对 于 ; = %，S, 是 可 应 用 的 。 口 

我 们 现在 可 以 证 明 ， 在 每 一 次 计算 中 ，s, 和 s, 无 限 次 增加 。 按 照 推 论 3.5， 协 议 没 有 终止 配 
置 ， 因此， 每 次 计算 是 无 限 的 。 假 设 C 是 一 次 计算 ， 其 中 s, 和 ss 只 做 有 限 次 增加 ， 设 0,、os 是 C 
中 变量 所 取 的 最 大 值 。 根 据 声明 ， 在 a,。、as。、s, 和 ss 到 达 最 终 值 之 后 ，p 的 发 送 <pack，in, [0,]， 
0s >， 或 者 4 的 发 送 <pack ，ins[o0,]，o > 都 是 永远 可 应 用 的 。 因 此 ， 按 照 F1， 有 一 个 包 会 无 限 
多 次 的 发 送 ， 按 照 F2， 有 一 个 包 会 无 限 多 次 的 接收 。 但 是 ， 当 p 接 到 带 有 序列 号 s, 的 包 时 ， 就 
会 引起 s, 增 加 (反之 ， 对 于 gq 也 是 如 此 )， 这 与 ,和 ss 中 没有 一 个 会 无 限 增加 的 假设 相 蔬 盾 。 
此 定理 3.4 得 证 。 o 

本 节 ， 对 假设 F1、F2 做 了 简要 的 讨论 。F2 是 连接 P、4 的 信道 必须 满足 的 进行 数据 交换 的 
最 小 质量 要 求 。 显 然 ， 如 果 某 些 字 inf] 从 不 通过 信道 ， 这 些 字 最 终 也 不 可 能 发 送 。 在 协议 中 ， 
假设 Fl 是 利用 超时 条 件 实 现 的 :如果 在 某 一 特定 的 时 间 内 ，a, 不 增加 ， 则 再 次 传输 in,[a,]。 正 
如 已 在 本 章 的 引言 中 讨论 的 那样 ， 如 果 不 考 虑 时 间 问 题 ， 就 可 证 明 协 议 的 安全 性 。 
3.1.3 协议 讨论 

1. 限制 进程 中 的 存储 空间 

由 于 在 图 3-1 所 示 的 算法 中 ， 每 一 进程 存 有 无 限 数量 的 信息 量 (数组 jn 和 out) 和 利用 了 无 


界 的 序列 号 ， 因 此 ， 在 计算 机 网 络 中 是 不 可 能 实现 的 。 现 在 要 证 明 ， 任何 时 刻 ， 只 须 存 储 有 
RSE, REBT. RL=1,+1,. 


引 理 3.6 P 获 含 着 ，p 的 发 送 <pack，w，i> 仅 对 i < a, + 上 是 可 应 用 的 。 
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由 引 理 3.3 可 得 ,i < av + 工 。 口 


513.7 忆 获 含 着 ， 如 果 outp [i] + udef, AA, i<s +L. 

证 明 。 由 式 (2p), a,>i-l,; 因此 ,1<w+ 六 ， 由 引 理 3.3 可 得 ，i<w+Z。 o 

图 3-2 说 明了 这 两 个 引 理 的 结果 。 进 程 p 仅 需要 存储 字 in, la.. s+ 1,~1]。 因 为 这 些 是 进程 
Pp 能 发 送 的 字 。 称 它们 为 p 的 发 送 窗 (在 图 3-2 中 表示 为 $)。 无 论 什么 时 候 ，a, 增 加 ，p 都 丢弃 
不 再 落 人 发 送 窗 内 的 字 (在 图 3-2 中 表示 为 A)。 无 论 什 么 时 候 s, 增 加 ，p 都 从 产生 这 些 字 的 地 

方 读 取 发 送 窗 内 的 下 一 字 。 按 照 引 理 3.6，p 的 发 送 窗 至 多 包含 L 个 字 。 _ 

类 似 的 证 明 给 出 了 p 中 存储 数组 ouz 器 所 需 的 空间 范围 。 对 于 ; < s,， 因 为 out, [i] 的 值 不 再 
改变 ， 可 以 假设 p 将 不 可 逆 地 输出 这 些 值 ， 不 再 存储 它们 (在 图 3-2 中 表示 为 W)。 对 于 i > Sp 
+ 上， 由 于 ouiy li] = udef, out, 四 中 的 这 些 值 也 不 需 存储 在 进程 中 ， 子 数组 out, [sp .. s, + L-1] 
称 为 p 的 接收 窗 。 在 图 3-2 中 ， 接 收 窗 用 u 表 示 wudef， 用 RR 表示 已 经 接收 的 字 。 进 程 中 ， 仅 存储 
沙 人 该 窗 内 的 字 。 引 理 3.6 和 3.7 表 明 ， 每 个 进程 的 任 一 时 刻 ， 至 多 存储 2Z 个 字 。 





A= 丢弃 的 输入 
S 二 发 送 窗 


2. 限制 进程 中 的 序列 号 


R = 已 接收 的 CTT = 发 送 /接收 窗 


we 


图 3-2 协议 的 滑动 窗口 


如 果 利 用 信道 的 先进 先 出 性 质 ， 也 可 对 进程 中 的 序列 号 进行 限制 。 利 用 先进 先 出 的 假设 ， 
可 以 证 明 ， 进 程 p 所 接收 的 包 的 序列 号 总 是 落 和 以 s 为 中 心 的 2 的 范围 内 。 注 意 ， 这 是 第 一 次 


利用 先进 先 出 假设 。 
引 理 3.8 定义 断言 已 为 


P' =P 
A <pack, w, i> Ẹ<pack, w', i'> 之 后 (Q@, 中 ) = i>i'-L (4p) 
A <pack, w, i> 在 <pack，w',，i'> 之 后 (Q) =i>i'-L (4q) 
A <pack, w, i> EQ, =i > a,-l, (Sp) 
A <pack, w, i>€Q, =i > a,- (5q) 


是 图 3-1 所 示 的 算法 的 不 变 式 。 


证 明 。 因 为 已 证 明 P 为 不 变 式 ， 我 们 只 需 证 明 初始 时 式 (4p)、 式 (4q)、 式 (Sp) 和 式 
(Sq) 成 立 ， 并 在 每 次 转移 中 保持 不 变 。 因为 在 初始 配置 中 ， 队 列 为 空 ， 因 此 式 (4p). È 
(4q)、 式 (5p) AR (5q) 成 立 。 以 下 证 明 ， 转 移 保持 这 些 断 言 。 
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S, 为 证 明 5, 保 持 式 (4p) MA ($p)， 观 察 可 得 S, 不 向 2 添加 包 ， 也 不 改变 ar 的 值 。 
为 证 明 S, 保 持 式 (5q)， 观 察 可 得 如 果 S, 为 6, 增加 包 <pack，w，i>， 那 么 ，i> ww， 由 
引 理 3.3， 这 蕴含 着 F> a, - 1。 
为 证 明 S, 保 持 式 (4q)， 观 察 可 得 ， 如 果 <pack，w', 己 > 在 @, 中 ， 那 么 由 式 (19) 可 
得 ,< 5, +4， 因此 ， 如 果 S, 增 加 包 <pack，w， 旋 且 i> ab, 则 由 引 理 3.3 可 得 ，i' <a, + 
L<i+L. 

: 为 证 明了 R, 保 持 式 (4p) AA (4q)， 观 察 可 得 R, 不 向 O。， 或 者 Qs 添加 包 。 
为 证 明 RR, 保 持 式 (5p)， 观察 可 得 当 a, 增 加 (一旦 接 到 <pack，w',， i>) 到 i' -lst1 时 ， 
则 对 Q, 中 其 余 的 包 <pack，w，i>， 由 式 (4p) 可 得 ，i > i'~-L。 因 此 ， 在 ,增加 之 后 ， 
i> a-l, RSL. 

为 证 明 R, 保 持 式 (5q)， 观 察 可 得 R, 不 改变 Qs 或 者 a 。 

L: LAM ROW, hack Ba Ma fl; 因此 保持 式 (4p)、 式 (4q)、 式 (Sp) 

和 式 (Sq) AB. 
由 协议 的 对 称 性 ，S。、R。 和 Ls 同样 保持 P'。 
引 理 3.9 PRS 


3 














<pack, w, i>€Q0,>5,-L <i<s,+L 
和 
<pack, w, i>G@Q,>s,-L <i<s,+L 


证 明 。 设 <pack, w, i>€ Q,. (Ip) AS, i<s,+1,, A533, Bi<s,+L. H 
式 (Sp) 可 得 ，i> a -~l,， 由 引 理 3.3， 得 i > s ~L 。 对 于 属于 Qs 中 的 包 也 有 类 似 证 明 。 o 

按照 引 理 ， 用 模 k 的 序列 号 足以 发 送 该 包 ， 这 里 > 2L 。 确 实 ， 已 知 sp 和 i mod k， 进 程 p 就 
可 计算 出 i。 

3. 参数 的 选择 

常数 训 和 /对 协议 的 效率 有 着 重要 的 影响 。 其 对 协议 吞吐 量 的 影响 ， 在 文献 [Sch91， 第 2 
章 ] 中 进行 了 概率 分 析 。 它 的 最 优 值 取决 于 与 系统 有 关 的 参数 量 ， 例 如 ， 

(1) 通信 时 间 ， 即 ， 进 程 的 两 次 连续 操作 之 间 的 时 间 。 

(2) 来 回路 由 延迟 ， 即 ， 从 P 到 4 传输 一 个 包 ， 并 得 到 从 4 到 z 的 确认 的 平均 时 间 。 

(3) 差错 概率 ， 某 一 个 包 丢 失 的 概率 。 

4. 交替 位 协议 

清 动 窗口 协议 的 一 个 有 趣 的 特例 是 ， 当 L = 1 时 ， 即 , J, = 10 = 0 时 (或 者 反之 亦 然 )。 
变量 a, 和 ag 初 始 化 为 -和 一 !，， 而 不 是 0。 可 以 证 明 ，a, + J, = silat |, = ss 总 是 成 立 ， 因 此 ， 
在 协议 中 只 需 存 储 a, 和 s。(as 和 ss。) 其 中 之 一 。 如 果 对 计时 器 的 使 用 进一步 做 出 限制 ， 以 确保 
站 点 依次 发 送 消息 ， 就 得 到 著名 的 交替 位 协议 (alternating-bit protocol) [Lyn68]。 


3.2 基于 计时 器 的 协议 


通过 分 析 Fletcher 和 Watson 提 出 的 端 到 端 消 息 通信 的 At- 协 议 的 简化 形式 ， 我 们 研究 在 通信 
协议 的 设计 和 验证 中 ， 计 时 器 所 起 的 作用 。 该 协议 由 [FW78] 提 出 ,但 本 节 取 自 [Tel91b，3.2 
节 ]， 并 作 了 简化 。 该 协议 不 仅 提供 了 数据 传输 机 制 (正如 3.1 节 平衡 滑动 窗口 协议 )， 而 且 还 
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能 打开 连接 和 关闭 连接 。 对 于 消息 的 丢失 、 复 制 以 及 重 排 具 有 弹性 。 

协议 的 状态 信息 (数据 传输 部 分 ) 保存 在 称 为 连接 记录 的 数据 结构 中 。( 在 3.2.1 就 会 看 到 
连接 记录 中 有 些 什么 信息 )。 连 接 记 录 随 着 连接 的 打开 和 关闭 ， 建 立 和 撤销 连接 。 因 此 ， 如 果 
连接 记录 存在 ， 则 称 连 接 是 打开 的 〈 在 某 一 站 点 )。 

为 了 集中 讨论 协议 的 相关 方面 ( 即 ， 连 接管 理 机 制 以 及 计时 器 在 其 中 的 作用 )， 考 虑 该 协 
议 的 一 个 简化 版 本 。 更 实际 和 有 效 的 关于 该 协议 扩展 的 讨论 ， 参 见 [FW78] 和 [Tel91b,3.2 节 ]。 
以 下 对 这 里 所 描述 的 协议 作 了 4 个 方面 的 简化 。 

(1) 一 个 方向 ” 仅 考 虑 一 个 方向 的 数据 传输 ， 即 ， 从 p 到 g 的 方向 。 有 了 时 称 p 为 发 送 方 ，g 
为 接收 方 。 然 而 ， 需 要 注意 协议 对 消息 确认 在 相反 方向 进行 ， 即 ， 从 g 到 p 的 方向 。 

通常 数据 需要 在 两 个 方向 进行 传输 。 为 了 处 理 这 种 情况 ， 需 要 另外 执行 第 二 个 协议 ， 在 
这 个 协议 中 ，P 和 4 的 作用 相反 。 也 可 以 引入 组 合 的 data/ack 消 息 ， 在 组 合 消息 中 ， 既 包含 《与 
序列 号 对 应 的 ) 数据 ， 也 包含 基于 计时 器 协议 的 确认 包 中 的 信息 。 

(2) 单字 接收 窗 ”接收 方 不 存储 任何 序列 号 高 于 期 望 数 的 数据 包 。 仅 当下 一 个 到 达 的 包 
是 期 望 虑 的 包 时 ， 才 加 以 考虑 ， 并 立即 进行 发 送 。 该 协议 的 一 个 更 复杂 的 版 本 ， 是 存储 早先 
时 刻 到 达 的 具有 较 大 序列 号 的 包 ， 并 在 所 有 县 有 较 低 序列 号 的 包 都 到 达 后 ， 才 发 送 它们 。 

(3) 简化 的 计时 假设 ”协议 用 最 少量 的 计时 器 表示 。 例 如 ， 假 设 只 要 接收 方 的 连接 是 打 
开 的 ， 接 收 进 程 可 以 在 任 一 时 刻 发 送 确认 消息 。 另 一 种 方法 是 ， 在 较 小 小 的 时 间 间 隔 内 发 送 确 
认 消 息 ， 但 这 会 使 协议 更 复杂 

同时 ， 在 对 协议 的 描述 中 ， 如 在 3.1 节 ， 省 略 了 用 于 引发 数据 包 重 发 的 计时 器 机 制 。 仅 仅 
包括 确保 协议 安全 性 所 需 的 机 制 。 

(4) 单字 包 ”发 送 方 只 能 在 每 一 数据 包 中 放 进 一 个 字 。 如 果 数 据 包 能 够 包含 几 块 连续 的 
字 ， 则 协议 会 更 有 效 。 

协议 是 基于 计时 器 的 ， 即 ， 进 程 可 访问 物理 时 钟 设 备 。 对 系统 中 的 时 间 及 计时 器 作 以 下 
假设 。 

(5) 全 局 时 间 “时间 的 全 局 度量 可 扩展 到 系统 中 的 所 有 进程 中 ， 即 ， 每 一 事件 都 是 在 某 
一 时 刻 发 生 。 假 设 每 一 事件 自身 的 持续 时 间 为 0， 事 件 发 生 的 时 刻 对 进程 来 说 是 不 可 见 的 。 

(6) 有 限 的 包 生命 期 包 的 生存 期 可 由 常数 4 (最 大 包 生 存 期 ，maximum packet lifetime) 
限定 。 因 此 ， 如 果 一 个 包 在 时 刻 o 发 送 ， 在 时 刻 z 接 收 ， 那 么 


O<t<o+pu 
如 果 一 个 包 在 信道 中 被 复制 ， 则 在 初始 包 (或 者 丢失 ) 发 送 后 的 时 间 内 ， 必须 接 到 每 一 
复制 。 
(7) 计时 器 ”进程 不 能 得 知 其 行为 的 绝对 时 间 ， 但 是 它们 可 以 访问 计时 器 。 计时 器 是 进 
程 的 一 个 实 值 变量 ， 其 值 按照 时 间 连 续 递减 ( 当 在 其 他 地 方 没有 明确 赋值 时 )。 更 精确 地 ， 如 


灯 Xt 是 一 个 计时 器 ， 我 们 用 Xx" 表示 它 在 时 刻 :的 值 ， 且 如 果 在 4 与 5 之 间 ， Xt 未 赋 给 不 同 的 值 ， 
那么 


XO ~ Xt = t, t, 


注意 ， 在 时 间 6 内 ， 它 们 按照 6 准确 递 碱 ， 在 这 种 意义 上 ， 这 些 计 时 器 准确 运行 。 在 3.2.3 
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节 ， 我 们 将 讨论 计时 器 遭受 漂移 的 情况 。 

如 3.1 节 ， 发 送 方 的 输入 字 可 以 通过 一 个 无 限 大 的 数组 in, 来 模拟 。 同 时 ， 不 在 p 中 存储 整 
个 数组 ; 在任 一 时 刻 ，p 只 能 访问 它 的 一 部 分 。 当 p 得 到 产生 该 字 的 进程 的 下 一 字 时 ， 可 扩展 
(在 较 高 端 ) 被 进程 p 访 问 的 部 分 in,。 发 送 方 称 此 操作 为 字 的 接受 。 

在 本 节 中 ， 对 接收 方 的 发 送 字 模拟 不 同 于 3.1 节 。 接 收 方 不 是 写 入 【无限 大 ) 数组 ， 而 是 
通过 称 为 发 送 字 的 操作 将 字 交 给 消费 进程 。 在 理想 的 情况 下 ，in, 中 的 每 一 字 只 传输 一 次 ， 并 
且 顺 序 正 确 。 

然而 协议 的 规范 ， 要 弱 于 此 。 这 是 因为 在 有 限 的 时 间 间 隔 内 ， 协 议 只 允许 处 理 in, 中 的 每 
一 个 字 。 协 议 不 能 保证 在 有 限 的 时 间 内 能 接收 字 ， 因 为 在 这 期 间 ， 有 可 能 委 失 所 有 的 包 。 因 
此 ， 在 发 送 协议 产生 差错 报告 来 表明 该 字 可 能 丢失 的 地 方 ， 协议 的 规范 允许 报告 的 丢失 的 可 
能 性 存在 。( 因此 ， 要 是 高 级 协议 能 够 再 次 向 进程 p 提 供 该 字 ， 那 么 复制 就 可 能 有 效 地 出 现 ; 
然而 在 此 ， 我 们 并 不 关注 这 个 问题 。) 3.2.2 节 中 要 证 明 的 协议 性 质 包 括 : 

(1) Lak ”在 p 接 受 字 后 的 有 限时 间 内 ，in, 中 的 每 个 字 由 gq 发 送 ， 或 者 p 进 行 报告 (“可 能 
ER"). 

(2) 有 序 gq 所 发 送 的 字 按 照 严 格 递增 次 序 出 现在 in, 中 。 


3.2.1 协议 表示 


当先 前 连接 不 存在 时 ， 协 议 中 首先 打开 连接 ， 然 后 发 送 方 接收 下 一 个 字 ， 或 者 包 到 达 时 ， 
接收 方 能 够 发 送 它 。 在 这 个 协议 中 ， 要 打开 一 个 连接 ， 在 数据 包 发 送 之 前 ， 无 需 交 换 任 何 控 
制 消息 。 这 使 在 每 次 连接 中 ， 对 于 仅 传输 几 个 字 的 应 用 ,协议 是 相对 有 效 的 (小 量 快速 传输 )。 
当 发 送 方 《接收 方 ) 的 连接 是 打开 的 ， 谓 词 cs (或 者 cr) 为 真 。 对 于 发 送 方 (或 接收 方 )， 这 
通常 不 是 明确 定义 的 一 个 布尔 变量 ; 而 是 通过 连接 记录 的 存在 性 定义 的 一 个 打开 连接 。 进 程 
通过 查找 自己 的 打开 连接 表 的 连接 记录 的 存在 性 ， 测 试 连接 是 否 打 开 。 

当 发 送 方 打开 一 个 新 的 连接 时 ， 它 就 开始 对 接收 的 字 从 0 编号 。 连 接 中 已 经 接收 的 字 的 编 
号 用 High 表 示 ， 已 经 收 到 确认 的 字 用 Low 表 示 。 这 表明 (类似 于 3.1 节 的 协议 ) 发 送 方 可 能 传 
输 序 列 号 从 Low 到 High-1 的 包 。 反 之 ， 在 发 送 方 接 到 字 的 时 刻 开 始 的 长 为 U 的 时 间 间 隔 里 ， 发 
送 方 可 能 只 发 送 一 字 。 为 此 ， 将 计时 器 Ui 四 与 每 一 个 字 in, (TAK; 在 接受 的 那 一 刻 ， 计 时 器 
设置 为 U， 对 于 要 传输 的 字 而 言 ， 计 时 器 必须 为 正 。 因 此 ，p 的 发 送 窗 由 范围 在 Low 到 High-1 
的 字 组 成 ， 且 相关 的 计时 器 为 正 。 


: real ; (* Maximum packet lifetime *) 


: Teal ; (* Length of send interval *) 
: real ; (* Receiver time-out value: R > U + p *) 


: real ; (* Sender time-out value: S > R + 2u *) 
发 送 方 连接 记录 : 


Low : integer ; (* Acknowledged words of current connection *) 
High : integer ; (* Accepted words of current connection *) 
St : timer ; (* Connection timer *) 





图 3-3 基于 计时 器 的 协议 变量 
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接收 方 连接 记录 : 
Erp : integer ; (* Next expected sequence number *) 
Rt : timer; (* Connection timer *) 
iH PRB: 
: channel; (* Data packets for q *) 


: channel; (* Acknowledgement packets for p *) 


: integer init 0 ; (* Words in previous connections *) 
: boolean init false ; (* Connection exists at receiver *) 
: boolean init false; (* Connection exists at sender *) 





图 3-3 ( 续 ) 


协议 发 送 的 数据 包 ， 由 位 (序列 开始 位 ， 以 下 讨论 )、 序 列 号 和 字 组 成 。 为 了 分 析 协 议 ， 

每 一 数据 包 还 有 第 4 个 域 ， 称 为 剩余 包 生 存 期 。 按 照 有 限 生存 期 的 假设 ， 在 被 接收 或 者 丢失 之 

前 ， 它 表示 包 仍 能 在 信道 中 所 花费 的 最 大 时 间 。 当 包 发 送 时 ， 总 认为 剩余 包 生 存 期 为 4。 协 议 

中 所 发 送 的 确认 包 仅仅 由 4 所 期 望 的 下 个 序列 号 组 成 ; 同样 ， 为 了 分 析 方便 ， 每 一 确认 包 也 含 
剩余 包 生 存 期 。 








Ay: (* Accept next word *) 
begin if not cs then 
begin (* Connection is opened first *) 
create (St, High, Low) ; (* cs := true *) 
Low := High := 0 ; St:=S 












end ; 
Ut[B + High] := U ; High := High +1 





end 






Sp: (* Send ith word from current connection *) 
{cs A Low< i< High A Ut[B + i] > 0} 
begin send (data, (i = Low), i, inp[B + i], 4) ; 

St := S 







end 






R,: (* Receive an acknowledgement *) 
{cs A (ack,i,p) € Mp} 
begin receive (ack,i,p) ; Low := max (Low,7) end 






E,: (* Generate error report for possibly lost word *) 
{cs A Ut([B+ Low] < —2n-R} 
begin error|B + Low] := true ; Low := Low +1 end 







Cp: (* Close the connection *) 

{cs A St<0 A Low = High} 

begin B := B + High ; delete (St, High, Low) end 
(* cs := false *) 







图 3-4 Fk A AH: 


EPR AD HAH AIRY ROT BB SCE ASE BB RS 由 于 每 个 字 的 有 限 发 送 时 间 间 
隔 和 包 的 有 限 生存 期 ， 因此 在 信道 中 找到 每 个 字 的 时 间 限 制 在 +U 的 时 间 间 隔 内 ， 自 接受 字 
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的 那 一 刻 起 。 这 使 得 接收 方 在 接 到 字 之 后 ， 要 丢弃 大 约 u+U 的 时 间 单 位 的 信息 ; 这 个 时 间 之 
后 ， 不 会 有 复制 到 达 ， 因 此 ， 没 有 复制 发 送 的 危险 。 每 次 发 送 一 个 字 ， 就 将 计时 器 Ri1 设 为 R， 
其 中 R 是 常数 ， 满 足 选 择 R> U + 14。 如 果 在 R 时 间 单 位 内 ， 要 发 送 下 一 个 字 ， 则 更 新 计时 器 Ri， 
否则 就 要 关闭 连接 。 选 择 发 送 方 的 计时 器 的 值 满足 : 当 关 闭 连接 时 ， 永 远 不 会 接 到 确认 消 
息 ; 因此 在 发 送 包 之 后 ， 至 少 在 5S 时 间 间 隔 内 应 保持 连接 ，5 是 常数 ， 满 足 S > R +24。 每 次 发 
送 一 个 包 ， 就 将 计时 器 St 设 为 $s， 仅 当 St < 0 时 ， 才 关闭 连接 。 如 果 仍 然 剩余 一 些 字 ( 如， 还 未 
收 到 确认 的 字 )， 那 么 在 关闭 连接 之 前 ， 必 须 报告 这 些 字 。 





R,: (* Receive a data packet *) 
{ (data, s,i,w,p) € M; } 
begin receive (data, s,i,w,p) ; 
if cr then 
if i = Exp then 
begin Rt := R ; Exp := i + 1 ; deliver w end 
else if s = true then 
begin create (Rt, Exp) ; (* cr := true *) 
Rt := R ; Exp := i + 1 ; deliver w 










end 






end 





S,: (* Send an acknowledgement *) 
cr 





{er} 
begin send (ack, Ezp, p) end 





(* Close connection if Rt times out, see action Time *) 





图 3-5 接收 方 协议 算法 


在 一 个 关闭 的 连接 内 ， 当 接 到 包 时 ， 接 收 方 利 用 序列 开始 位 决定 连接 是 否 能 被 打开 (以 
及 包 中 发 送 的 字 )。 当 确认 了 以 前 的 所 有 字 或 者 报告 可 能 丢失 字 后 , 发 送 方 将 开始 位 设置 为 真 。 
当 4 接 到 处 于 打开 连接 状态 的 包 时 ， 发 送 所 包含 的 字 ， 当 且 仅 当 包 的 序列 号 等 于 下 一 个 期 望 的 
序列 号 (存储 在 Exp 中 )。 


Loss: {mEM} (*M is either Mp or M, *) 
begin remove m from M end 


Dupl: {meM}  (* M is either M, or M, *) 
begin insert m in M end 


Time: (* 6 > 0 *) 
begin forall i do Utli] := Utli] — 6 ; 
St:= St-6; 


Rt:= Rt-6; 
if Rt < 0 then delete (Rt, Exp) ; (* cr := false *) 
forall (.., p) € Mp, Mq do 
begin p := p- ô; 
if p < 0 then remove packet 
end 





图 3-6 协议 转移 补充 算法 
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接 下 来 讨论 发 送 协议 中 变量 B 的 作用 。 这 是 一 个 辅助 变量 ， 引 人 的 目的 是 用 于 协议 的 正确 
性 证 明 。 发 送 方 对 每 次 连接 中 的 字 从 0 开始 编号 ,为 了 区 别 不 同 连接 中 的 字 , 在 协议 的 分 析 中 ， 
对 所 有 的 字 按 照 数字 连续 递增 的 方式 编号 。 因 此 在 发 送 方 按 ; 素 引 一 个 字 时 ， 所 指 的 字 的 “ 绝 
对 ” 数 应 为 B + i， 其 中 8B 是 在 以 前 连接 中 由 p 收 到 的 包 的 总 数 。“ 内 部 ”和 “绝对 ”字号 码 的 对 
应 关系 参见 图 3-7。 在 协议 的 实现 中 ， 并 不 存储 B， 发 送 方 “忘记 了 ”in, [0..8-1] 中 的 所 有 字 。 


第 一 次 连接 的 字 ”第 二 次 连接 的 字 当前 连接 
B+Low B+High 








per eee 


cree? 


协议 中 所 用 的 索引 : 





图 3-7 字 的 序列 号 


通信 子 系统 用 两 个 多 集 M, 和 Ms 表示 ，M, 和 M, 分 别 表示 目 的 地 分 别 为 Pp 和 gq 的 包 。 发 送 方 协 
议 参见 图 3-4 所 示 的 算法 ， 接 收 方 协议 参见 图 3-5 所 示 的 算法 。 图 3-6 所 示 的 算法 给 出 了 补充 的 
系统 转移 ， 它 并 不 与 进程 中 协议 的 步骤 相对 应 。 这 些 转移 代表 信道 故障 和 时 间 的 进行 。 在 转 
移 中 ，Loss 和 Dupl M 代 表 M, 或 者 M,。Time 的 作用 使 得 系统 中 的 所 有 计时 器 碱 小 5。 它 发 生 在 
两 个 离散 避 件 应 用 的 5 时 间 单位 内 。 当 接收 方 的 计时 器 为 0 时 ， 它 的 连接 关闭 。 


3.2.2 协议 的 正确 性 证 明 


用 一 组 引 理 和 定理 来 证 明 所 要 求 的 协议 性 质 。 以 下 所 定义 的 断言 Po 表示 : 只 要 系统 中 有 
包 存在 ， 发 送 方 的 连接 始终 是 打开 的 ， 并 且 在 当前 的 连接 中 ， 这 些 包 的 序列 号 有 正确 的 含义 。 


Pom csmSt<S (1) 
A cr=>0<Rt<R (2) 
A Wi< B+ High: Ut[i] < U (3) 
^A Y<., p>E M, M; O<p<u (4) 
A <data, s, i, w, p >EM,=cs A St< p+ur+R (5) 
Acr=>cs A St> Rt+u (6) 
A<ack, i, p>EM,=cs A St>p (7) 
A<data, s, i, w, p>EM = (w=in,[B+i] A i< High) (8) 


为 解释 式 (3)， 在 发 送 方 不 存在 连接 的 地 方 ， 将 所 有 配置 中 的 High 值 设 为 0。 

引 理 3.10 Po 是 基于 计时 器 协议 的 不 变 式 。 | 

证 明 。 初 始 时 ， 连 接 不 存在 ， 也 没有 包 。B = 0， 这 意味 着 Po 为 真 。 

Ap: A (1) 保持 ， 这 是 因为 ， 对 St 的 赋值 总 是 使 S! = S。 式 (3) 保持 ， 是 因为 在 增加 
High ZÑ, Ut(B + High WME AU. X (5)、 式 (6) 和 式 (7) 保持 ， 是 因为 只 能 增加 8 的 值 。 
A (8) 保持 ， 是 因为 High 只 能 增加 。 

Sy: A (1) 保持 ， 这 是 因为 ，St 总 设 为 s。 式 (4) 保持 ， 是 因为 在 剩余 包 生 存 期 (u) 的 
有 时 间 内 发 送 包 。 式 (5) 保持 ， 是 因为 发 送 包 <..，A >，51 设 为 5 且 S =R + 24。 式 (6) 和 式 
(7) 保持 ， 是 因为 S! 只 能 增加 。 式 (8) 保持 ， 是 因为 新 包 满足 w = in, [B + i] 有 i < High. 





qr 
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: 及, 的 行为 并 不 改变 Po 中 提 到 的 任何 变量 。 包 的 去 除 保持 式 (4) 和 式 (7) 的 性 质 。 
: 隐 的 行为 并 不 改变 Po 中 提 到 的 任何 变量 。 
: Co 的 行为 使 式 (5)、 式 (6) MA (7) 的 结论 为 假 。 但 是 (由 式 (2)、 式 (5)、 式 


(6) 和 式 (7)) 仅 当 前 提 为 假 时 ，C* 是 可 应 用 的 。 同 时 Co 改变 有 的 值 ， 但 由 式 (5) 
和 式 (7)， 没 有 包 传输 ， 因 此 式 (8) 成 立 。 


: Ri 总 被 赋值 R， 因 此 式 (2) 保持 。 仅 当 收 到 包 <data，s，i, w，p > 时 ， 将 Rt 设 为 R， 


因此 式 (6) 保持 。 式 (4) 和 式 (5) Bidies A St > R+ HA。 


: 因为 每 个 包 在 剩余 包 生存 期 4 内 发 送 ， 因 此 式 (4) 保持 。 式 (7) 成 立 是 因为 ， 当 cr 


为 真 时 ， 且 p = 4 时 ， 发 送 包 <ack，i，p >， 因 此 由 式 (2) 和 式 (6), St > p 


Loss: 删除 包 只 能 使 前 提 为 假 ， 式 (4)、 式 (5)、 式 (7) 和 式 (8) 保持 。 
Dupl: 式 (4)、 式 (5)、 式 (7) 和 式 (8) 保持 ， 仅 当 普 在 信道 中 时 ， 包 mm 的 插入 才 是 可 


RAR), KARA, AERA ZA, AAR. 


Time: 式 (1). X (2) AA (3) 保持 ， 因 为 t+、Rt 和 Ut 四 只 能 减 小 ， 且 当 R! 变 到 0 时 ， 


接收 方 的 连接 关闭 。 式 (4) 保持 ， 是 因为 p 只 能 减 小 ， 且 当 它 的 p- 域 值 为 0 时 ， 删 
除 包 。 观 察 Time 将 所 有 计时 器 (包括 包 的 p- 域 ) 减 小 相同 量 ， 因 此 保持 了 所 有 形 
如 Xt> Yt+ C 的 断言 。 其 中 Xt 和 Yi 是 计时 器 ，C 是 常数 。 这 就 表明 式 (5)、 式 (6) 
AUK (7) 保持 。 口 


协议 的 第 一 个 要 求 是 每 个 字 最 终 被 发 送 ， 或 者 被 报告 有 丢失 。 定 义 谓词 OK(D) 为 OKCD) 人 
error [i] = true V q 已 发 送 in, [i]. 
可 以 证 明 ， 如 果 没 有 报告 ， 执 议 并 不 损失 任何 字 。 定 义 断 言 己 为 


P, = Po 
A ncs 一 Vi <B : Ok(i) (9) 
A cs 一 Vi <B + Low: Ok(i) (10) 
A <data, true, I, w, p>EM, => Vi<B+I: Ok(i) (11) 
A cr = Vi <B + Exp: Oki) (12) 
A <ack, I, p>EM,=>Vi< B+: Oki) (13) 


引 理 3.11 Pl 是 基于 计时 器 协议 的 不 变 式 。 
证 明 。 首 先 观 察 ， 对 某 些 i， 一 旦 OK(i) 变 为 真 ， 从 那 以 后 就 不 会 变 为 假 。 初 始 时 ， 无 连接 ， 


没有 包 ， 
: Ar 的 行为 打开 一 个 连接 ， 因 为 在 Low = 0 和 Vi < 8 时 ， 连 接 被 打开 ， 由 式 (9) 可 得 ， 


且 B=0， 这 蕴含 着 已 成 立 。 


Ok 保持 式 (10) 成 立 。 


: S, 的 行为 可 能 发 送 包 <data，s，i, w,，p >， 但 因为 "为 真 ， 仅 当 [ = Low 时 ， 由 式 (10) 


可 得 , A (11) 保持 。 


: 如 果 接 到 包 <ack，1，p >，Low 的 值 可 能 增加 。 然 而 ， 式 (10) 保持 是 因为 式 (13), 


Vi<B+l: 如 果 接 到 确认 回答 ，OK(i) 成 立 。 


: EE, 的 应 用 可 能 使 得 Low 的 值 增加 ， 但 是 错误 报告 的 产生 确保 式 (10) 被 保持 。 
: Cb 的 行为 使 cs 为 假 。 但 是 仅 当 St < 0 且 Low = High 了 时，Cs 是 可 应 用 的 。 式 (10) BS 


着 : Vi < B+ High: 在 Cs 的 执行 之 前 ，OK(i) 成 立 ， 因 此 式 (9) 被 保持 。 在 执行 中 ， 
A (10) 的 前 提 为 假 , 式 (5)、 式 (6) 和 式 (7) HSER (11)、 式 (12) MÈ 
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(13) 的 前 提 为 假 ; 因此 式 (10). x (11), (12) 和 式 (13) 保持 。 
R: 首先 考虑 4 接 到 包 <data，itrue，1，w，p > 且 连 接 不 存在 (cr 为 假 ) 的 情况 ， 那 么 ， 
Vi<B+1: 由 式 (11)，OkGD) 保 持 ， 且 在 行动 中 ，w 被 发 送 。 当 mw = in, (B+ Ot. H 
A (8), MIRE Exp := 1+ 1 保持 式 (12). 
HEZ ERB) <data, s, Exp, w, p > 且 连 接 打 开 的 情况 ， 此 时 Exp 增 加 。 由 式 
(12), Wi< B+ Exp: 在 收 到 之 前 ，OK(i) 成 立 ， 在 行动 中 ， 字 w = in, (B+ Exp] 被 发 
送 。 因 此 Exp 的 增加 保持 式 (12)。 
S; 由 式 (12)， 发 送 <ack，Exp，k > 保持 式 (13)。 
Loss: Loss 的 应 用 只 能 使 得 子 句 的 前 提 为 假 。 
Dupl: 即使 在 插入 之 前 ， 仅 当 相 应 子 句 的 前 提 为 真 时 ， 包 m 的 插入 才 是 可 应 用 的 。 
Time: X (9)~ 式 (13) 没有 明确 提 到 计时 器 。g 所 进行 的 包 的 删除 和 关闭 只 能 使 得 式 
(11)、 式 (12) 或 者 式 (13) 的 前 提 为 假 。 口 
在 做 出 附加 的 假设 后 ， 可 以 证 明 协 议 规范 的 第 一 部 分 。 没 有 这 一 假设 ， 发 送 方 不 会 报告 
可 能 丢失 的 字 ; 在 图 3-4 所 示 的 算法 中 , 在 字 的 发 送 间隔 结束 后 的 2U+R 时 间 内 ,不 会 出 现 报告 ， 
但 也 并 不 是 最 终 一 定 会 出 现 。 因 此 ， 我 们 做 附加 假设 ， 在 合理 时 间 内 ， 即 在 Ur [B + Low] = - 
24-R~A 之 前 ，p 实 际 上 会 执行 E,， i 
定理 3.12 (无 损 ) 在 p 接 受 字 之 后 的 U + 2 + R + A 时 间 内 ，g 发 送 in, 中 的 每 个 字 ， 或 者 p 
报告 。 
证 明 。 在 接受 字 in, 四 之 后 ，B + High > 1 成 立 ， 并 且 继 续 成 立 。 如 果 在 接受 字 in, [之 后 
的 某 个 指定 时 间 段 内 连接 关闭 ， 那 么 B > 1, HX (9) 可 得 结论 成 立 。 如 果 在 这 个 时 间 段 内 ， 
连接 没有 关闭 且 B + Low < 7， 那 么 ，i 四 的 发 送 间隔 结束 之 后 的 24 + R 时 间 内 可 以 报告 范围 
B+ Low .. [的 所 有 字 。 这 表明 ， 发 送 间 隔 结 束 之 后 的 24 + R + 4 接收 之 后 的 U + 2u + R+ ARE 
已 经 发 生 。 这 也 蕴含 着 ，7 < B+ Low， 由 式 (10), 或 者 发 送 字 ,或 者 进行 报告 。 口 
为 建立 协议 的 第 二 个 正确 性 要 求 ， 必 须 证 明 所 接受 的 每 一 个 字 都 有 高 于 以 前 接受 的 字 的 
下 标 。 用 Pr 表示 最 新 发 送 的 字 的 下 标 (为 方便 起 见 ， 初 始 时 pr =-1，Ut[-1] = -o)。 定 义 断 言 
PL: 


P, = P, 
A <data, s, i, w, p> EM, = Ut [B + i] > p-u (14) 
A i, < i <B + High = Ut [i] < Ut [i] (15) 
A cr= Rt > Ut [pr] + u (16) 
A pr <B + High A (Ut [pr] >-u = cr) (17) 
A cr => B+ Exp=pr+1 (18) 


引 理 3.13 P, 是 基于 计时 器 协议 的 不 变 式 。 

TERA. BGT, MH, B+ High 为 0。~cr 成 立 且 Ur [pr] <-u, WEROH ~ 式 (18) 成 立 。 

A, 因为 新 接受 的 字 得 到 计时 器 的 值 U0， 由 式 (3) 可 得 ， 该 值 至 少 等 于 所 有 已 接受 字 的 
值 ， 因 此 式 (15) 保持 。 

S: 因为 U1 [B+ i>0， 包 发 送 时 有 p = A， 因 此 式 (14) 保持 。 

C: 由 式 (5)、 式 (6) 可 得 ， 当 Cb 是 可 应 用 时 , 式 (14)、 式 (16) 和 式 (18) 的 前 提 
AR RER (14)、 式 (16) AR (18) 保持 。 因 为 8 被 赋值 B+High 且 计时 器 不 改 
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变 ， 因 此 式 (15) 保持 。 因 为 B 被 赋值 B+High 且 pr 和 cr 不 改变 ， 因 此 式 (17) 保持 。 

Rs 当 R1 设 为 R 时 (一旦 接受 字 )，Ui [pr] < U, AX (3) T, R>2U + U. WER 

(16) 保持 。 由 式 (8) 可 得 ，pr < B+ High，cr 为 真 ， 因 此 式 (17) 保持 。 因 为 Exp 
为 i+1，pr 为 B +i, HERA (18) 为 真 。 

Time: 因为 Ut [B + 站 与 p 减 小 相同 量 ( 仅 当 包 的 删除 使 前 提 为 假 )， 因 此 式 (14) 成 立 。 
因为 Ut (i) 和 Uz [i] 减 小 相同 值 ， 因 此 式 (15) 成 立 。 由 于 cr 在 执行 中 没 变 为 真 ， 
Rt 和 Ut [pr] 减 小 相同 值 ， 因 此 式 (16) 成 立 。 式 (17) 成 立 是 因为 ， 如 果 Rr 变 为 
<0， 它 的 结论 为 假 ， 由 式 (16), RASAU [pn] 变 为 《-A。 因 为 如 果 cr 不 为 假 ， 
B、Exp 和 和 pr 都 不 改变 ， 式 (18) 成 立 。 

R E, 和 S$, 不 改变 式 (14) ~ 式 (18) 中 的 任何 变量 同样， 通过 用 与 前 面 证 明 中 所 使 用 的 相 

同 变量 ，Loss 和 Dupl 使 得 式 (14) ~ 式 (18) 成 立 。 o 

引 理 3.14 ”由己 可 得 ， 


<data, s, i, w, p>EM,= (cr V B+i,>pr). 


证 明 。 由 式 (14) 可 得 ，<data，s, i, w, p>E M, #8Ut [B +i]>p-u>-u, 如 果 杂 + 
i<pr, HK (15), pr < B+ High， 则 有 Ur [pr] > -Kn， 于 是 由 式 (17)，cr 为 真 。 口 

定理 3.15 (有 序 ) 9 所 发 送 的 字 按 照 严格 递增 次 序 出 现在 in 中。 

证 明 。 假 设 q 接 收 包 <data，s ,i ，w，p > 并 发 送 w。 如 果 在 接收 之 前 连接 不 存在 ，B + i > 
pr 《由 引 理 3.14)， 因 此 ， 在 in, 中 字 w 出 现在 位 置 pr 之 后 。 如 果 连 接 的 确 存在 ，i; = Exp, Ale 
由 式 (18) 可 得 ，B+ii=B+ Exp= pr+1， 这 蕴含 着 w = in, [pr+1]。 口 


3.2.3 协议 讨论 


在 本 节 的 引言 部 分 已 经 讨论 了 协议 的 一 些 扩展 。 通 过 对 本 节 协 议 、 引 入 和 使 用 的 技术 做 
进一步 讨论 结束 本 节 。 [97 | 

1. 协议 的 质量 

无 损 和 有 序 要 求 都 是 安全 性 质 。 如 果 只 给 出 简单 的 解决 方法 ， 即 协议 并 不 发 送 或 接收 任 
何 包 ， 当 丢失 信息 时 ， 也 不 报告 每 个 字 。 这 样 的 协议 不 能 完成 任何 形式 的 从 发 送 方 到 接收 方 
的 数据 传输 。 不 能 说 它 是 一 种 “好 的 ”方法 。 

好 的 解决 问题 的 方法 不 仅 要 满足 无 损 和 有 序 要 求 ， 而 且 当 丢失 发 生 时 ， 尽 可 能 少 地 报告 。 
为 了 做 到 这 一 点 ， 在 本 节 的 协议 中 增加 一 种 机 制 ， 使 得 它 可 以 重复 地 〈 直 到 发 送 间隔 结束 ) 
发 送 每 个 字 直 到 收 到 确认 消息 。 发 送 间隔 必须 足够 长 ， 才 能 使 某 一 个 字 复 制 传输 若干 次 ， 这 
样 丢失 一 个 字 的 概率 就 变 得 很 小 了 。 

楼 收 方 的 机 制 是 ， 在 打开 连接 的 状态 ， 无 论 什 么 时 候 发 送 或 者 接收 到 一 个 包 ， 就 触发 发 
送 确 认 消 息 。 

2. 有 限 的 序列 号 

可 以 限制 协议 中 所 用 的 序列 号 ， 其 证 明 类 似 于 平衡 滑动 窗口 协议 [Tel91b，3.2 节 ] 中 的 引 
理 3.9。 为 此 ， 必 须 假设 对 p 的 接收 速率 进行 限定 ,满足 如 果 以 前 的 第 L 个 字 至 少 过 了 U +2u + 
R 的 时 间 ， 才 能 接收 下 一 个 字 、 将 六 值 


{(High < L)v (vB+ High- L]<-R~2y)| 
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加 到 A, 中 。 在 这 一 假设 下 ， 接 收 数据 包 的 序列 号 在 以 Exp 为 中 心 的 2 范围 内 ， 确 认 的 序列 号 在 
以 High 为 中 心 的 L 范 围 内 。 因此， 序列 号 可 以 模 2L 传 输 。 
3. 行为 设计 与 不 变 式 
”利用 断言 方法 ， 关 于 通信 协议 的 推理 可 归 约 到 公式 的 操作 。 公 式 操作 是 一 种 安全 的 技术 ， 
因为 每 一 步 都 经 过 仔细 地 证 明 ， 因 此 ， 推 理 中 产生 错误 的 可 能 性 很 小 。 存 在 着 失去 对 协议 以 
及 协议 与 所 考虑 公式 的 关系 的 总 体 看 法 的 风险 。 应 从 实际 和 形式 两 方面 来 理解 协议 的 设计 问 


题 。Fletcher 和 Watson[FW78] 认 为 ， 控 制 信息 必须 受到 “保护 " ， 在 这 种 意义 上 ， 即 它 不 能 被 


包 的 丢失 或 者 复制 所 改变 ， 这 是 实际 的 观点 。 在 断言 方法 中 ， 对 于 控制 信息 “意义 ”的 验证 
反映 在 选取 某 种 断言 作为 不 变 式 。 这 些 不 变 式 的 选取 以 及 转移 的 设计 构成 了 一 种 形式 的 观点 。 
根据 公式 的 “形式 ”可 以 重新 阐述 Fletcher 和 Watson 的 结果 ， 即 选取 哪些 公式 作为 协议 的 不 变 
式 以 减少 包 的 丢失 和 复制 。 
所 有 与 包 有 关 的 P, 的 不 变 式 子 句 具有 形式 
Vm EM : Alm) 


显而易见 ， 这 个 子 句 通过 包 的 复制 或 者 丢失 保持 。 在 后 面 的 章节 中 ， 我 们 会 看 到 不 变 式 
具有 更 一 般 的 形式 ， 例 如 ， 
dimer 


t= ImEM: Am). 


由 于 包 的 委 失 或 者 复制 ， 具 有 这 些 形式 的 断言 可 以 为 假 。 因 它 不 能 用 于 必须 容忍 这 些 错 
误 的 算法 的 正确 性 证 明 中 。 
类 似 的 观察 可 应 用 到 Time 行 为 的 不 变 式 形式 中 。 这 种 行为 保持 所 有 具有 形式 


Xt >Yt+C 


的 断言 。 这 里 Xt 和 Yt 是 计时 器 ，C 是 常数 。 

4. 不 精确 的 计时 器 

被 Time 的 行为 模型 理想 化 的 计时 器 ， 它 在 5 时 间 单 位 正好 减 小 5。 但 实际 上 ， 计 时 器 会 遭 
受 不 精确 之 苦 ， 称 之 为 漂移 (drift)。 总 是 假设 漂移 是 E- 有 限 的 ， 对 于 已 知 的 常数 eE。 它 表明 ， 
在 6 时 间 单 位 内 ， 计 时 器 减 小 量 为 56， 满足 6/( 1+E) < 6'< 6x(1+E)。( 一 般 选 取 E 的 阶 为 10- 
或 者 10. ) 在 图 3-8 所 示 的 算法 中 ， 用 Time-E 模 拟 计时 器 的 行为 。 

可 见 , Time 保 持 了 特殊 形式 Xt > Yt + C 的 断言 , 因为 计时 器 在 不 等 式 两 边 严 格 减 小 相同 量 ， 
并 且 Xt 2 Yt + CHE (Xt -6) > (Yt -6) +C。 对 于 Time-E 可 做 类 似 观察 。 对 于 实数 Xt、Yi、 
ô. O°. ô", rnc, HR S> 0 和 r > 1, 


或 者 


(Xt > ryto)n(S <6’ < bxr)a(2 <6" < xr) 
r 
ae 
(Xt-6') >r2(¥r-6")+c o 
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因此 ，Time-E 保 持 形 如 
Xt> (146) Yt+c. 
的 断言 。 
通过 修改 不 变 式 ， 现 在 协议 适合 于 具有 漂移 计时 器 的 情形 。 为 使 其 他 的 行为 也 保持 修改 
过 的 不 变 式 ， 协 议 中 的 R 和 3 必须 满足 
R> (1+ (1+ QU +(I+ Su) HS> (1+9(2u+(1+ 9R). 
除了 修改 的 常数 ， 协 议 中 其 余地 方 保持 不 变 ， 图 3-9 中 给 出 了 它 的 不 变 式 。 


Time-e: { 6 > 0 } 
begin (* The timers in p decrease by 6’ *) 
i (* hy 6 < 6x (1+e) *) 
forall i do vat 
St := St— 6’; 
(* The timers in q decrease by 6” *) 
* 6 n 
; <6" ¢ 6x (1+.e) * 
(ks (+e) *) 


:= Uti] ~ 6’ ; 


Rt := Rt — 
if Rt < 0 then delete (Rt, Exp) ; 
(* The p-fields run exactly *) 
forall (.., p) € Mp, Mq do 
begin p :=p -6 ; 
if p < 0 then remove packet 
end 





图 3-8 修改 的 Time 行 为 算法 





P= ests (x) 
Acr=>0<Ri<R (2') 
A^ Vi < B+ High: Uti] < U (3’) 
AM... P) E Mp, Mg: 0<p<p (4') 
A (data, s,i,w,p) € Mg = cs A St > (1+e)(o+u+(1+6)R) (5) 
A cr = cs A St > (1+e)((1+e)Rt+ p) (6’) 
A (ack,i,p) € Mp > cs A St > (1+e) xp (7') 
A (data, s,i,w,p) € My > (w = in,[B + i] Ai < High) (8’) 
A aes => Vi < B: Ok(i) 9’) 
A cs = Vi < B + Low: Ok(i) (10) 
^ (data, true, I,w,p) € M >VYi< B+I: Ok(i) (11’) 
A cr = Vi < B+ Exp: Ok(i) (12°) 
A (ack,I,p) € Mp >Vi< B+I: Ok(i) (13’) 
A (data, s,i,w,p) € M; = Ut[B + i] > (1+ .)(p— n) (14’) 
A i, S iz < B+ High > Utli] < Utlia] (15') 
A er => Rt > (1 +)((1 + e) Ut[pr] + (1 + €?p) (16’) 
A pr < B+ High A Ut[pr] > -(1+e)u => cr (17’) 
Acr>B+Ep=pr+l1 > (18’) 





图 3-9 带 有 计时 器 漂移 协议 的 不 变 式 
定理 3.16 ”PP 是 基于 计时 器 协议 的 不 变 式 ， 具 有 E- 有 限 的 计时 器 漂移 。 协 议 满足 无 损 和 
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HERE. 
习题 
3.1 节 
3.1 证明 如 果 在 公平 性 假设 F1 和 F2 中 ， 只 有 F2 成 立 ， 平 衡 滑动 窗口 协议 并 不 满足 最 终 发 
送 要 求 。 
3.2 ”证 明 在 平衡 滑动 窗口 协议 中 ， 如 果 L = 1，ab 和 a 分 别 初始 化 为 -ls 和 -1,， 那 么 ，a, + 
L = spea, + 1, = sq 总 是 成 立 。 


3.2% 


3.3 ”在 基于 计时 器 的 协议 中 ， 发 送 方 报告 某 个 字 可 能 丢失 ， 而 实际 上 接收 方 已 经 正确 地 
发 送 了 这 个 字 。 
(1) 在 这 种 现象 出 现 的 地 方 ， 描 述 协 议 的 一 次 执行 。 
(2) 是 否 能 设计 一 种 协议 ， 使 得 发 送 方 在 限定 的 时 间 内 产生 错误 报告 ， 当 且 仅 当 接 收 方 
没有 发 送 该 字 ? 
3.4 ”假设 由 于 错误 的 时 钟 设备 ， 接 收 方 可 能 未 能 及 时 关闭 它 的 连接 。 描 述 基于 计时 器 协 
议 的 一 次 计算 ， 其 中 发 送 方 未 能 报告 字 的 丢失 。 
3.5 ”描述 基于 计时 器 协议 的 一 次 计算 ， 其 中 收 到 序列 号 大 于 0 的 包 时 ， 接 收 方 打 开 一 个 
连接 。 
3.6 Time-E 的 行为 不 能 模拟 剩余 包 生存 期 中 的 漂移 。 为 什么 不 能 ? 
3.7 证 明定 理 3.16。 
3.8 网 络 工程 师 想 要 利用 基于 计时 器 的 协议 ， 但 却 要 通过 对 忆 , 做 下 列 更 改 以 尤 许 提早 报 
告 字 的 丢失 。 
E,: (* Generate error report for possibly lost word *) 
{Ut [B + Low] <0 } 
begin error [B + Low] := true; Low := Low + 1 end 
更 改过 的 协议 仍然 满足 无 损 和 有 序 的 要 求 吗 ? 或 者 还 必须 再 做 其 他 修改 ? 
给 出 这 个 更 收 的 优 缺 点 。 
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进程 (计算 机 网 络 中 的 一 个 节点 ) 一 般 不 能 与 其 他 进程 通过 信道 直接 相连 。 节 点 只 能 将 
信息 包 直 接 发 给 节点 的 一 个 子 集 ， 这 个 子 集 称 作 节 点 的 近邻 【neighbor)。 路 由 是 用 于 描述 判 
定 过 程 的 术语 ， 通 过 路 由 ， 布 点 可 以 选择 一 个 (或 多 个 ) 近邻 进行 包 的 转发 ， 最 终 到 达 目 的 
节点 。 路 由 算法 的 设计 目标 是 为 每 一 个 节点 产生 一 个 决策 过 程 来 完成 这 项 功能 ， 并 保证 每 个 

包 的 传输 。 
很 显然 ， 必 须 将 网 络 拓扑 结构 信息 存储 在 节点 中 作为 〈 局 部 ) 判定 过 程 的 工作 基础 。 称 
此 信息 为 路 由 表 。 有 了 这 些 路 由 表 的 指引 ， 在 算法 上 就 可 以 将 路 由 问题 分 为 两 部 分 ， 表 结构 
的 定义 与 算法 设计 有 关 。 

(1) 路 由 表 计 算 ”网 络 初始 化 时 要 计算 路 由 表 。 如 果 网 络 的 拓扑 结构 发 生变 化 ， 就 要 及 
时 更 新 路 由 表 。 

(2) EHR 当 要 在 网 络 中 发 送 包 时 ， 必 须 利用 路 由 表 进 行 包 的 转发 。 

评判 一 个 “好 的 ”路 由 方法 应 包括 以 下 几 个 方面 : 

(1) 正确 性 算法 必须 将 提供 给 网 络 的 每 个 包 传递 至 其 最 终 目 的 节点 。 

(2) 效率 ”算法 必须 通过 “好 的 ”路 径 发 送 包 ， 例如， 经 历 延迟 小 的 路 径 ， 确 保 整个 网 
络 的 高 吞吐 量 。 如 果 算 法 利用 “最 好 的 ”路 径 ， 则 称 算法 是 最 优 的 。“ 

(3) 复杂 度 ”路 由 表 的 计算 方法 必须 利用 尽 可 能 少 的 消息 、 时 间 及 存储 空间 。 复 杂 度 的 
其 他 方面 还 有 ， 如 何 进行 快速 路 由 决策 ， 如 何 快速 准备 传输 包 等 。 但 本 章 对 这 些 方面 关注 较 
少 。 

(4) 健壮 性 在 网 络 拓 扑 结构 改变 时 〈 通 道 或 节点 的 增加 或 删除 ) ， 算 法 能 够 更 新 路 由 表 。 
以 便 能 够 在 改变 的 网 络 中 执行 路 由 功能 。 

(5) 适应 性 ”算法 通过 更 改 路 由 表 ， 来 平衡 信道 和 节点 的 负载 以 避免 那些 通过 繁忙 信道 
和 节点 的 路 径 ， 而 选择 某 些 负载 较 轻 信道 和 节点 。 

(6) 公平 性 算法 必须 为 每 个 用 户 提供 相同 程度 的 服务 。 

这 些 准则 有 时 是 相互 矛盾 的 ， 如 果 取 准则 的 子 集 ， 大 多 数 算法 会 执行 的 很 好 。 

通常 用 图 表示 网 络 ， 图 中 的 顶点 表示 网 络 中 的 节点 。 如 果 两 节点 在 网 络 中 相 邻 ( 即 ， 它 
们 之 间 有 通信 信道 ) ， 则 两 节点 在 图 中 有 一 条 边 相 连 。 算 法 的 最 优 性 取决 于 图 中 最 优 路 径 ; 有 
儿 种 表示 最 优 的 方法 ， 每 一 种 都 有 自己 的 路 由 算法 : 

(1) 里 小 跳 数 ”可 以 用 路 径 中 的 跳 数 ( 节点 之 间 通 过 的 信道 数 或 者 步 数 ) 来 度量 使 用 路 
径 的 成 本 。 最 小 跳 数 路 由 算法 利用 具有 最 少 可 能 跳 数 的 路 径 。 

(2) RB ”静态 地 为 每 一 信道 赋 以 权 值 ( 非 负 )。 用 路 径 中 信道 的 权 值 之 和 度量 路 径 
的 代价 。 最 短路 径 算法 利用 具有 最 小 代价 的 路 径 。 . 

(3) RYDER ”动态 地 为 每 一 信道 赋 以 权 值 ， 这 取决 于 信道 中 的 信息 量 。 最 小 延迟 算法 
反复 地 修改 路 由 表 ， 使 得 总 能 选择 (接近 ) 最 小 总 延迟 的 路 径 。 信 道 的 延迟 与 实际 的 信息 量 
有 关 ， 并 且 网 络 中 所 传输 的 各 种 包 相 互 影响 ，4.1 节 讨论 信息 量 对 路 由 算法 的 影响 。 


104 





62 ERA th R 


路 径 最 优 性 的 其 他 表示 方法 可 能 在 特定 应 用 中 有 用 ， 这 里 不 做 讨论 。 

本 章 概述 

本 章 中 讨论 下 面 一 些 内 容 。4.1 节 描述 的 结果 表明 ， 至 少 对 于 最 小 跳 数 路 由 和 最 短路 径路 
由 ， 可 用 一 棵 根 向 d 的 生成 树 将 所 有 包 最 优 地 路 由 至 同一 目的 节点 4。 因 而 ， 当 进行 路 由 决策 
时 ， 包 的 源 节点 可 以 忽略 。 

4.2 节 描述 了 具有 加 权 信道 的 静态 网 络 路 由 表 计算 的 算法 。 算 法 分 布地 计算 每 一 对 节点 的 
最 短路 径 ， 并 在 每 个 源 节点 中 存储 通 往 各 目的 节点 的 路 径 中 的 第 一 个 近邻 。 这 种 算法 的 缺点 
是 ， 当 网 络 的 拓扑 结构 发 生变 化 时 ， 需 要 重复 所 有 计算 。 因 此 算法 是 不 健壮 性 的 。 

4.3 节 讨论 的 变更 算法 没有 这 种 缺点 。 通 过 部 分 再 计算 路 由 表 ， 它 能 适合 故障 信道 或 者 恢 
复 信道 。 为 使 分 析 简单 ， 将 它 表示 成 最 小 跳 数 路 由 算法 ， 即 ， 用 跳 数 来 度量 路 径 代价 。 有 可 
能 修改 变更 算法 ， 使 其 能 够 处 理发 生 故 障 或 进行 恢复 的 加 权 信道 。 

4.2 和 4.3 节 的 路 由 算 靶 ， 使 用 包含 所 有 可 能 的 目的 节点 的 路 由 表 。 对 于 节点 较 小 的 大 网 络 
来 说 ， 对 存储 空间 的 需求 巨大 。4.4 节 讨论 一 些 路 由 策略 ， 包 括 如 何 将 拓扑 信息 编码 在 节点 的 
地 址 中 ， 以 便利 用 更 短 的 路 由 表 或 做 更 少 的 表 查找 。 这 些 所 谓 的 “压缩 ” 路 由 算法 通常 并 没 
有 用 到 最 优 路 径 。 此 外 ,讨论 了 树 模式 路 由 算法 、 区 间 路 由 算法 和 前 绥 路 由 算法 。 

4.5 节 讨论 了 分 层 路 由 方法 。 在 这 些 方法 中 ， 网 络 被 分 成 一 些 (连通 的 ) BE, HRB H 
和 和 焦 间 路 由 作出 区 分 。 这 种 范 型 可 以 减少 -个 路 径 中 必须 做 的 路 由 决策 的 数量 ， 或 者 碱 少 各 
节点 中 存储 路 由 表 所 需要 的 空间 的 大 小 。 


4.1 基于 目的 节点 的 路 由 


转发 包 时 所 做 的 路 由 决策 通常 基于 包 的 目的 节点 (和 路 由 表 中 的 内 容 )， 与 包 的 原始 发 送 
方 〈 源 节点 ) 无关 。 路 由 可 以 忽视 源 节点 ， 仍 然 可 以 利用 最 优 路 径 ， 正 如 本 节 结 果 所 蕴含 的 。 
虽然 其 结果 并 不 依赖 于 为 路 径 选 取 特 定 的 优化 准则 ， 但 是 下 述 假设 必须 成 立 。( 回忆 ， 如 果 一 
条 路 径 所 包含 的 每 个 节点 至 多 出 现 一 次 ， 称 这 条 路 径 是 简单 路 径 。 如 果 第 一 个 节点 等 于 最 后 
一 个 节点 ， 称 路 径 是 一 个 回路 。) 

(1) 经 过 路 径 P 发 送 包 的 代价 与 实际 利用 的 路 径 无 关 。 尤 其 是 其 他 消息 利用 P 的 边 时 。 

这 种 假设 使 得 我 们 可 以 把 利用 路 径 P 的 代价 看 作 是 路 径 的 函数 。 用 C(P) ER 表示 P 的 代价 。 

(2) 两 条 路 径 连 接 的 代价 等 于 被 连接 路 径 代价 的 和 。 即 对 所 有 i = 0，..…，， 


C(<uo, Ui, 5 U>)=C(< uo, .., Ui>)+C( Cu, ..., Ux >)。 


因而 ， 空 路 径 < wo > (从 wo 到 wo 的 路 径 ) 满足 C(< wo>) = 0。 

(3) 图 中 不 包含 负 代价 的 回路 。 

(最 小 跳 数 和 最 短路 径 代 价 准 满足 这 些 准 则 。) 如 果 不 存在 从 u 到 v 具 有 更 小 代价 的 路 径 ， 
称 从 uw 到 vy 的 路 径 是 最 优 的 。 观 察 可 得 ， 最 优 路 征 并 不 总 是 惟一 的 ， 可 能 存在 不 同 的 路 径 都 具 
有 相同 的 (最 小 ) 代价 。 

引 理 4.1 设 w、v 位 V 中 的 顶点 ， 如 果 G 中 存在 一 条 从 u 到 Vv 的 路 径 ， 那 么 存在 一 条 最 优 简 单 
路 径 。 

证 明 。 因 为 只 有 有 限 条 简单 路 径 ， 因 此 存在 一 条 从 zx 到 v 且 具有 最 小 代价 的 简单 路 径 ， 记 
为 56。 即 ， 对 于 从 wu 到 v 的 每 一 条 简单 路 径 P'，C(5。) < C(P')。 其 余 要 证 明 ，C( So) 是 每 一 条 
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( 非 简单 ) 路 径 代价 的 下 界 。 

设 V = {y1，.…，vw }。 通 过 不 断 地 从 P 中 去 除 包含 vi/、v; 的 回路 ， 可 以 证 明 ， 对 于 从 wu 到 v 的 
每 一 条 路 往 P， 存 在 一 条 满足 C(P')< C(P) 的 简单 路 径 P'。 令 Po = P， 对 于 i = 1，…，N， 构 
造 路 径 P; 和 如下。 如果 vj 在 Pi 中 至 多 出 现 一 次 ， 那 么 ，Pi = Pi1。 否 则 ， 记 Pi = < to, oo U>, 
设 思 和 志 分 别 是 vj 在 Pi 中 的 第 一 次 和 最 后 一 次 的 出 现 ， 令 


R =< A (= u, Yep aoe aly >. 


通过 构造 ，P; 是 从 u 到 v 的 路 径 ， 包 含 所 有 节点 {vo，.…，vi} 至 多 一 次 ， 因 此 Pw 是 从 u 到 v 的 
简单 路 径 。Pi, 由 P; 和 回路 Q = Ujo sees 万 ,组 成 ， 因此 C(Pi1)= C(Pi) + C(8)。 又 因为 不 存在 
负 权 值 的 回路 ， 这 蕴含 着 ，C( Pi) <C (Pi1)， 因 此 C(Pn) < C(P)。 

由 50 的 选取 ，C(5o)<C(Py)， 由 此 可 得 ，C(5o)<C(P) 成 立 。 口 

如 果 G 包 含 负 权 值 的 回路 ， 则 最 优 路 径 未 必 存 在 。 对 于 每 一 条 路 径 ， 都 存在 另 一 条 代价 比 
它 更 小 的 包含 负 回 路 的 路 径 。 下 面 的 定理 ， 假 设 G 是 连通 的 (对 于 不 连通 图 ， 可 将 定理 单独 用 
到 它 的 每 一 连通 分 量 上 )。 

定理 4.2 对 于 d E V， 和 存在 一 棵 树 Ts = (V，Es)， 满 足 Es CE， 且 对 每 一 节点 v EV，Ty 中 
从 Vv 到 d 的 路 径 是 G 中 从 vy 到 d 的 一 条 最 优 路 径 。 

证 明 。 设 V = {v1，.…，vw}。 我 们 用 归纳 法 构造 一 组 具有 下 列 性 质 的 树 T; = (V, E) (对 
于 i=0, ..., N) 

(1) 每 一 T 是 G 的 一 棵 子 树 ， 即 ，V; CV, E E 下， 且 7 是 一 棵 树 。 

(2) 每 一 T; (对 于 i < N) 是 Ti 的 一 棵 子 树 。 

(3) 对 于 所 有 i>0, vEV, dEV 

(4) 对 于 所 有 w E Vi， 工 中 从 w 到 4 的 简单 路 径 是 G 中 从 w 到 d 的 一 条 最 优 路 径 。 

这 些 性 质 蕴含 着 ，Ts 满 足 Tj 的 要 求 。 

为 构造 树 的 序列 ， 设 册 = {GME =O. WT ROP: 选择 从 vi 到 d 的 一 条 最 优 简单 路 
径 P = < wo，.…，u: >，! 是 满足 4 ET 的 最 小 下 标 (这 样 的 最 小 下 标 ! 存 在 ， 是 因为 w= d ET, ; 
可 能 ! = 0)。 现 设 

Viet =Y Ufu :j<1} 县 En = E, U (upu): j <I}, 

(图 4-1 显 示 了 这 个 构造 过 程 。) 易 证 ， 7 是 7 的 一 棵 子 树 ， 并 且 vaE Va。 为 证 Ti 是 一 棵 
树 ， 由 构造 可 得 ，7,: 是 连通 的 ， 并 且 节 点 数 比 边 数 多 一 个 。( To 具有 滞后 性 质 ， 在 每 一 阶段 
所 加 入 的 节点 数 和 边 数 一 样 多 。 ) 

下 面 要 证 明 ， 对 于 所 有 w E Vs ,Tis 中 从 w 到 d 的 (惟一 ) 路 径 是 G 中 从 w 到 d 的 一 条 最 优 
路 径 。 对 于 节点 w EV, CV ROL, AAW. 是 Ti 的 一 棵 子 树 。T, 中 从 w 到 ad 的 路 径 与 T 
中 的 路 径 相 同 ， 这 是 最 优 路 径 。 现 设 w = u, j< [是 Vi \ Vi 中 的 节点 。Q 表 示 工 中 从 ww 到 d 的 路 
径 ， 那 么 在 Ti 中 ，w 通 过 与 Q 连 接 的 路 径 < u, .., u> 连 到 4d。 下 面 证 明 这 就 是 G 中 的 最 优 路 
径 。 首先 ，P 的 后 缀 已 = < w，...，us> 是 从 ww 到 d 的 最 优 路 径 ， 即 ，C(P') = C(O): 9 的 最 优 性 
莹 含 着 C(P')> C(Q), 而 C(Q)<C(P') 蕴含 (由 路 径 代价 的 增加 性 ) 路 径 <uo，...， ui> 与 @ 
的 连接 要 比 P 具 有 更 小 的 代价 ， 这 与 P 的 最 优 性 矛盾 。 现 假设 从 zx 到 d 的 路 径 R 要 比 < Uj, ey U 
> 与 0 连接 的 路 径 代价 要 小 。 那 么 ， 由 前 面 的 观察 ，R 的 代价 比 P 的 后 级 < 局 ，.….，w> 的 代价 小 ， 


107 





64 BBD th X 


这 蕴含 着 (由 路 径 代价 的 增加 性 )，< uo，..….，u> 与 的 连接 要 比 P 具 有 更 小 的 代价 ， 这 与 P 的 
最 优 性 矛盾 。 口 

根 向 Gd 的 生成 树 称 为 d 的 汇集 树 ， 如 果 一 棵 树 具 有 定理 4.2 中 给 定 的 性 质 ， 则 称 该 树 为 最 优 
汇集 树 (optimal sink tree)。 最 优 汇集 树 的 存在 性 表明 ， 如 果 只 考虑 路 由 算法 ， 其 中 的 转发 
机 制 如 算法 4-2 所 示 ， 则 不 会 是 对 最 优 性 的 折 瑞 。 在 算法 中 ，iable_iookup, 是 只 有 一 个 变量 的 
局 部 过 程 ， 返 回 x 的 近邻 (在 参考 路 由 表 之 后 )。 当 所 有 目的 节点 为 4 的 包 ， 经 过 根 向 d 的 生成 
树 最 优 路 由 时 ， 如 果 对 于 所 有 ud，table_lookup。(d) 返 回 生成 树 Ts 中 4 的 父 节点 ， 则 转发 是 
最 优 的 。 








图 4-1 TT, 的 构造 


当 转 发 机 制 具有 这 种 形式 ， 并 且 拓 扑 结 构 不 再 (或 进一步 ) 变化 ， 使 用 下 面 结果 就 能 验 
证 路 由 表 的 正确 性 。 称 路 由 表 色 含 回路 (对 目的 节点 d)， 如 果 存 在 节点 wu，...， 凡 满足 ， 对 所 
Ai, u * d， 对 所 有 i <k, table_lookup,,(d) = um, Htable_ lookup,, (d) = u, 如 果 对 任何 目 
(08) 的 节点 4， 路 由 表 不 包含 回路 ， 称 它 是 无 回路 的 (cycle-free)。 


(* A packet with destination d was received or generated at node u *) 
ifd=u 


then deliver the packet locally 
else send the packet to table_lookup, (d) 





图 4-2 基于 目的 节点 的 转发 (节点 xz) WH 


引 理 4.3 当 且 仅 当 路 由 表 无 回路 ， 转 发 机 制 将 每 一 包 传递 至 其 目的 节点 。 

证 明 。 如 果 路 由 表 中 含有 到 目的 节点 d 的 回路 ， 如 果 它 的 源 节点 在 回路 中 ， 则 节点 gd 的 包 
永远 不 能 被 传递 至 目的 地 。 

假设 路 由 表 无 回路 ， 目 的 节点 为 4 ( 源 节点 为 m) HZH, u, m, HR. WREEF 
列 中 同一 节点 出 现 两 次 ， Au; = uj, 那么 ， 路 由 表 包 含 回路 ， 即 < wu;，..:，u>， 这 与 路 由 表 
pnd 因此 ， 每 一 节点 出 现 至 多 一 次 ， 蓝 含 着 序列 是 有 限 的 ， 设 结束 点 为 wu (k 

NN)。 按 照 转发 程序 ， 序 列 只 能 以 4 结束 ， 即 i = d, 因此 序列 在 至 多 N-1 次 跳跃 后 到 达 目 的 
P, o 

在 某 些 路 由 算法 ， 计 算 路 由 表 的 过 程 中 ， 路 由 表 并 不 是 没有 回路 的 ， 但 是 这 种 情况 只 能 
发 生 在 表 的 计算 阶段 完成 之 后 。 当 采用 这 种 算法 时 ， 在 路 由 表 的 计算 过 程 中 ， 包 可 能 遍历 回 
路 ， 但 如 果 拓 扑 结构 不 再 变化 后 ， 表 计算 完成 后 ， 在 至 多 N-1 次 跳跃 后 也 可 到 达 其 目的 节点 。 
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如 果 拓 扑 结构 不 断 变化 ， 即 ， 网 络 不 断 地 受到 拓扑 上 不 断 变化 的 无 穷 序列 制约 ， 即 使 在 更 新 
过 程 中 表 无 回路 ， 包 也 未 必 能 够 到 达 目的 节点 。 参 见习 题 4.1。 

最 小 延迟 分 支 路 由 算法 

如 果 要 求 路 由 经 过 最 小 延迟 路 径 ， 且 信道 的 延迟 取决 于 它 的 利用 率 《〈 本 节 开 始 所 作 的 假 
Be (1) 无 效 )， 则 不 能 只 用 路 径 函 数 作 为 评价 路 径 代价 的 惟一 因素 。 此 外 ， 还 必须 考虑 信道 
上 的 信息 量 。 为 避免 路 径 上 的 拥塞 (其 结果 是 更 高 延迟 ) ， 通 常 有 必要 将 具有 同一 源 节 点 - 目 
的 节点 对 的 包 沿 不 同 的 路 径 发 送 ， 将 该 对 的 信息 量 分 裂 成 一 个 节点 或 者 多 个 中 间 节 点 的 说 明 
参见 图 4-3。 利 用 不 同 路 径 到 达 同 一 个 目的 节点 的 路 由 方法 称 为 多 路 径 方法 或 者 分 支 路 由 方法 。 
由 于 分 支 路 由 方法 较 复 杂 ， 本 章 暂 时 不 予 考 虑 。 


到 节点 v 的 信息 量 被 分 裂 
在 节点 x 和 y 上 





图 4-3 分 支 路 由 例子 


4.2 所 有 点 对 之 间 的 最 短路 径 问 题 


本 节 讨 论 Toueg[Tou80a] 提 出 的 同时 计算 网 络 中 所 有 节点 的 路 由 表 的 算法 。 该 算法 计算 每 
一 对 节点 (u, v) 从 u 到 v 的 最 短路 径 ， 并 将 该 路 径 的 第 一 个 信道 存储 在 x 中 。 计 算 图 中 任意 两 
节点 之 间 最 短路 径 的 问题 称 为 所 有 点 对 之 间 的 最 短路 径 。 针 对 此 问题 的 Toueg 的 分 布 式 算法 是 
基于 Floyd-Warshall 提 出 的 集中 式 算法 [CLR90，26.4 节 ]。4.2.1 节 讨论 Floyd-Warshall 算 法 ， 
4.2.2 节 接着 讨论 Toueg 的 分 布 式 算法 ，4.2.3 节 简要 讨论 其 他 一 些 关 于 所 有 点 对 之 间 最 短路 径 问 
题 的 算法 。 


4.2.1 Floyd-Warshall 算 法 


给 定 加 权 图 G = (V，E)， 用 wu 表示 边 m 的 权 值 。 不 必 假设 w。 = ww,,， 但 假设 图 中 不 包含 
总 权 值 为 负 的 回路 。 路 径 < uo，.…，w> 的 权 值 定义 为 8 ase d (u, v) 表示 从 x 到 v 的 距离 ， 
是 从 x 到 "的 任意 路 径 的 最 小 权 值 (如 果 这 样 的 路 径 不 存在 ， 则 为 o)。 所 有 点 对 最 短路 径 问题 
是 为 每 个 4 和 计算 4 (un，v)。( 在 4.2.2 节 对 此 算法 进行 扩充 ， 以 便 存储 该 路 径 的 第 一 条 边 )。 
“为 计算 所 有 距离 ，Floyd-Warshall 算 法 采用 3- 路 径 表示 法 ， 即 存在 路 径 ， 其 上 的 所 有 中 间 
节点 属于 V 的 子 集 5。 

定义 4.4 设 5 是 V 的 于 集 。 称 路 径 < uo，...，u> 是 5- 路 径 ， 和 如果 对 于 所 有 i,0 <i<k, we 
5。 定 义 从 4 到 Vv 的 5- 距 离 必 (u,v) 为 从 u 到 Vv 的 任 一 最 小 加 权 5- 路 径 ( 如果 这 样 的 路 径 不 存在 ， 
则 为 m0)。 

算法 从 所 有 人 -路 径 开 始 ， 逐 步 计 算 更 大 子 集 $ 的 S- 路 径 ， 直 到 考虑 完 所 有 V- 路 径 。 有 如 
下 观察 。 
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命题 4.5 对 于 所 有 u 和 5，ds (wu，u) =0。 且 对 于 wu 关 v，5- 路 径 满足 下 列 规则 。 

(1) 存在 一 条 从 1 到 v 的 他 -路 径 ， 当 且 仅 当 zm EE。 

(2) 如 果 uv EE， M2, d (u, v) =œ n, GR, d(u, v) =”, 

(3) 如 果 S = SU{w}， 那 么 从 u 到 v 的 简单 路 径 5"- 路 径 是 从 UW 到 Vv 的 -路 径 ， 或 者 是 4 到 Ww 的 

S$- 路 径 与 w 到 v 的 5 路 径 的 连接 。 

(4) doRS'=SU{w}, 那么 ds (u, v) =min (ds (u, v), dlu, w) +ds(w, vy))。 

(5) 从 u 到 vy 存在 路 径 ， 当 且 仅 当 从 uu 到 Vv 存在 V- 路 径 。 

(6) dlu, v) =d (u, v) 

A., MER AUAS, d (u, u) 《0， 因 为 空 路 径 (由 0 条 边 组 成 ) 是 zx 到 v 上 且 权 值 为 0 的 
5- 路 径 。 没 有 一 条 路 径 有 更 小 的 权 值 ， 因 为 G 不 包含 负 权 值 的 回路 ， 因 此 ds (u, u) = 0。 

对 于 (1): 一 条 名 -路 径 没 有 中 间 节 点 ， 因 此 ， 从 u 到 v 的 儿 - 路 径 仅 由 信道 wwv 组 成 。 

对 于 (2): 由 (1) 直接 可 得 。 

WF (3): 从 wu 到 v 的 简单 5 一 路 径 将 节点 w 做 为 中 间 节 点 包含 一 次 或 者 0 次 。 如 果 w 不 是 5'- 
路 径 的 中 间 节 点 ， 则 它 就 是 一 条 5- 路 径 ， 否 则 它 就 是 两 条 5S- 路 径 的 连接 ， 一 条 连 到 w， 一 条 来 
自 w。 

对 于 (4): 由 引 理 4.1 可 得 ，( 如果 从 x 到 "存在 8'- 路 径 ) 就 存在 一 条 从 x 到 "长 为 ds (u, v) 
的 简单 3 路径 ,由 (3) TR, RAAB (u, v) = min{ d'(u, v), d(u, w) +d'(w, 
v) }。 

对 于 (5): 每 一 条 VY- 路 径 是 一 条 路 径 。 反 之 亦 然 。 

对 于 (6): 每 一 条 V- 路 径 是 一 条 路 径 。 反 之 亦 然 。 因 此 ， 一 条 最 优 的 -路径 也 是 一 条 最 
优 路 径 。 口 

利用 命题 4.5 ， 不 难 设计 所 有 点 对 之 间 最 短路 径 问 题 的 “动态 规划 算法 " 。 参 见 图 4-4 所 示 
的 算法 。 算法 首先 考虑 儿 - 路 径 , 然后 逐步 计算 更 大 子 集 $ 的 8- 路 径 (通过 “ 枢 轴 ” 循环 增 大 9 )， 
直到 考虑 完 所 有 路 径 。 





begin (* Initialize S to Ø and D to Ø-distance *) 
S:=2; 
forall u, v do 
if u = v then D{u, v] := 0 
else if w € E then Diu, 可 := wuv 
lse Dlu, v] := 00 ; 
(* Expand S by pivoting *) 
while S 4 V do 
(* Loop invariant: Vu, v : Diu, v) = d$ (u, v) *) 
begin pick w from V \ S 
(* Execute a global w-pivot *) 
forall u € V do 
(* Execute a local w-pivot at u *) 
forall v € V do 
Dlu, v] := min ( Dfu, v], Diu, w] + Dlw, v) ) ; 












S:= SU {w 
end (* Vu, v: Diu, v] = d(u, v) *) 










end 


图 4-4 Floyd-Warshall 算 法 
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定理 4.6 图 4-4 所 示 的 算法 的 计算 复杂 度 为 BG(N?)。 

证 明 。 算 法 开始 时 ， 如 果 w = v，D{fu，v] = 0; 如 果 uvEE，D[u, v] = ww BM, Dlu, v] 
= o， 且 3 = 多。 由 命题 4.5 的 (1) 和 (2) 部 分 ，Vu，v: D[u, 可 = ds (u, v) 成 立 。 在 以 w 为 枢 轴 
节点 (pivot node) 的 一 轮轴 循环 中 ， 用 w 扩 展 集合 $5， 对 Dfxu，v] 的 赋值 (由 命题 4.5 的 (3) 和 (4) 
部 分 ) 确保 断言 V4，v: D[u，v] = 4 (u,v) 仍然 是 循环 不 变 式 。 当 5 = V 时 ， 程 序 终止 。 即 ， 
(由 命题 4.5 的 (5)、(6) 部 分 和 循环 不 变 式 )，5- 距 离 就 是 最 终 所 求 距离 。 

主 循环 执行 N 次 ， 包 含 半 个 操作 (执行 可 并 行 或 囊 行 )， 这 蕴含 定理 中 陈述 的 结论 。 o 


4.2.2 Toueg 最 短路 径 算法 


基于 上 节 描 述 的 Floyd-Warshall 算 法 ，Toueg[Tou80a] 给 出 了 计算 路 由 表 的 分 布 式 算 法 。 可 
以 证 明 ，Floyd-Warshall 算 法 适合 于 作 此 用 途 ， 即 ， 在 分 布 式 系统 中 ， 它 的 假设 是 现实 的 。 算 
”法 最 重要 的 假设 是 图 中 不 包含 负 权 值 的 回路 。 分 布 式 系统 中 的 假设 的 确 如 此 ， 每 一 信道 的 代 
价 为 正 值 。 以 下 作 进 一 步 假设 。 

A1 网 络 中 每 一 回路 具有 正 权 值 。 

A2 网 络 中 每 一 节点 初始 时 知道 所 有 节点 的 标识 (集合 V)。 

AS 网 络 中 每 一 布点 知道 它 的 近邻 (对 于 节点 4x， 存储 在 Neigh, 中 ) 节点 以 及 其 传 发 信道 

的 权 值 。 

如 果 先 讨论 Toueg 算 法 的 简化 版 本 , “简单 算 法 ”( 图 4-5 所 示 的 算法 ) ， 再 讨论 Toueg 算 法 

的 正确 性 (图 4-6 所 示 的 算法 )， 就 会 更 容易 理解 。 


var Są : set of nodes ; 
Du : array of weights ; 
Nb, : array of nodes ; 


begin S, := Ø ; 
forall v € V do 
ifv=u 
then begin D,,[v] := 0 ; Nb„[v] := udef end 
else if v € Neigh, 
then begin D,,[v] := wy, ; Nby[v] := v end 
else begin D,[v] := œo ; Nb,[v] := udef end ; 
while S,,4V do 
begin pick w from V \ S, ; 
(* All nodes must pick the same node w here *) 
ifu=w 
then “broadcast the table Dy” 
else “receive the table Dy” ; 
forall v € V do 


end ; 
Su := Su U {wW} 





图 4-5 简单 算法 (节点 4) 
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1. 简单 算法 

为 将 Floyd-Warshal] 算 法 变 成 分 布 式 算法 ， 需 将 算法 中 变量 、 操 作 划 分 到 网 络 中 的 节点 上 。 
变量 DIxu，v] 是 属于 节点 u 的 变量， 按照 惯例 ， 可 用 下 标 表 示 : AREE, WEDI. XD, [v] 
的 赋值 必须 由 节点 执行 , 在 这 个 操作 中 , 当 需 要 节点 w 的 一 个 变量 值 时 ， 这 个 值 必 须发 送 给 x。 


. 在 Floyd-Warshall 算 法 中 ， 所 有 节点 必须 利用 来 自 枢 轴 节点 (循环 体 中 的 w) 的 信息 ， 枢 轴 节 


点 通过 (广播 ) 操作 将 此 信息 同时 发 送 到 所 有 节点 中 。 最 终 ， 算 法 不 仅 保存 最 短 8- 路 径 的 长 
度 (在 变量 D,[v] 中 )， 而且 保存 这 条 路 径 上 的 第 一 条 信道 (在 变量 Nb,[y] 中 )， 通 过 这 一 操作 
使 算法 得 以 扩充 。 

网 络 中 回路 权 值 为 正 的 假设 可 用 于 证 明 每 轮 循 环 后 路 由 表 中 不 存在 回路 。 

引 理 4.7 给 定 S 和 w， 假 定 

(1) 对 于 所 有 u，,，D,[w]= d (u, w), H 

(2) Xd (u, w) <%， 且 Ww， 那么 Nb,[w] 是 到 w 的 最 组 5- 路 径 上 的 第 一 条 信道 。 

RA, AMAT, = (V。，E,) 是 一 棵 根 向 w 的 树 ， 其 中 

(u E V, œ Dw] <0), E (uxE E, < (u#wh NB[w]=x))。 

证 明 。 对 于 uw， 如果 D,[w]< ©, IANb, [w] *udef 且 Dw tlw] < ©. FRM FHT E 
Vy. ww, FEE—P 4 x, (END [Ww] =x， 这 个 节点 满足 x EV。 

对 于 WV。 中 每 个 4 二 w 的 节点 ，E。 中 存在 一 条 边 ，7T, 中 的 节点 数 比 边 数 多 1， 这 足 以 表明 7T, 中 
不 存在 回路 。 因 为 ux E EWS, B(u, w) =a, + d(x, w), TT 中 回路 < uo, wj，...， u; > 的 
EES 


s s 
d (Uo W) = Opu FO yu HHO, u td (uo,w) ， 


即 ， Oun +wuo HOHO m0, RA ERASE. o 

现在 可 以 直接 将 Floyd-Warshall 算 法 转变 成 图 4-5 所 示 的 算法 。 每 一 节点 初始 化 它 自 己 的 变 
量 ， 并 执行 N 次 主 循环 。 算 法 到 此 并 没有 完结 ， 因为 还 没有 表明 如 何 有 效 地 广播 枢 轴 节点 表 。 
但 现在 可 以 认为 w 执 行 操作 “broadcast the table D,”, 其 他 节 点 执行 操作 “receive the table D,” , 
每 个 节点 可 以 访问 表 D,。 

为 了 保证 节点 以 同一 次 序 选 择 枢 轴 节点 ， 还 须 注意 操作 “pick w from V\ S”, 假设 所 有 节 
点 都 预先 知道 V， 可 以 简单 地 假设 以 某 种 规定 次 序 选择 节点 (如 节点 名 字 的 字母 次 序 )。 

下 面 定理 表明 简单 算法 的 正确 性 。 

定理 4.8 ”在 主 循环 远 代 N 次 后 ， 图 4-5 所 示 的 算法 在 每 一 个 节点 上 终止 ， 当 算 法 终止 在 节 
mult, Dvl= d(w,，v)， 并 且 和 如 果 从 U 到 Vv 的 路 人 茎 存在 ， 那么 Nb,[v] 是 从 u 到 vy 的 最 短路 径 上 的 第 
一 条 信道 ， 否 则 ，Nb, [v] = udef。 

证 明 。 由 Floyd-Warshall 算 法 (定理 4.6) 得 出 D.[v] 的 终止 性 和 正确 性 。 由 于 每 次 对 D,Iy] 
赋值 时 ， 都 更 新 Nb, [v] 的 值 ， 因 此 上 述 关于 Nb, [v] 说 法 成 立 。 口 

2. 改进 算法 

为 了 提高 图 4-5 所 示 的 算法 中 广播 的 效率 ， Toueg 观 察 到 ， 在 以 w 为 枢 轴 的 那 一 轮 开始 时 ， 
对 于 D,[w] = % 的 节点 a， 在 该 轮 的 执行 中 ， 并 不 改变 它 的 表 。 如 果 D,[w] = %， 则 对 每 个 y， 
Dw) + Do[v]< Du[y] 为 假 。 因 此 ， 只 有 属于 T。 (在 以 w 为 中 心 的 这 轮 循环 的 开始 时 ) 的 节点 需 
要 接收 w 的 表 ， 可 以 只 通过 属于 树 7, 的 信道 发 送 路 由 表 D, 来 有 效 地 进行 广播 ， 即 ，w 将 D, 发 送 
给 它 在 T, 中 的 子 节点 ， ,中 接收 该 表 (从 其 在 T, 中 的 父 节 点 ) 的 每 个 节点 ， 把 表 转 发 给 它 在 
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,中 的 子 节点 。 

在 以 % 为 枢 轴 节点 的 那 一 轮 的 开始 ， 满 足 D,[w] <% 的 节点 4 知道 它 的 父 节点 (Toh) 是 谁 ， 
但 不 知道 它 的 子 节 点 。 因 此 ， 每 一 节点 v 必 须 向 它 的 每 个 近邻 4 发 送 消 息 ， 告 知 z， 是 否 v 是 u 在 
T, 中 的 子 节点 。 图 4-6 所 示 的 算法 给 出 了 完整 算法 。 当 一 个 节点 得 知 它 的 近邻 中 哪些 是 它 在 T， 
中 的 子 节点 时 ， 就 可 以 参与 转发 w 表 的 过 程 。 算 法 中 利用 了 三 种 类 型 的 消息 : 

(1) 如 果 x 是 4 的 父 节 点 《T, 中 )， 则 在 w 为 枢 轴 节点 的 那 一 轮 的 开始 ，u 将 消息 <ys，w> 
(ys 代表 “你 的 子 节 点 ”) 发 送 至 x 。 

(2) 如 果 x 不 是 4 的 父 节 点 (TT, 中 )， 则 在 w 为 枢 轴 节点 的 那 一 轮 的 开始 ，u 将 消息 <nys， 
w> (nys 代 表 “ 不 是 你 的 子 节点 ”) 发 送 至 x 。 

(3) 在 以 w 为 中 心 的 那 一 轮 中 ， 发 送 消 息 <dtab，w，D>。 经 过 7, 的 每 条 边 把 D, 的 值 传输 
到 需要 该 值 的 每 一 节点 中 。 


var Są : set of nodes ; 
D, : array of weights ; 
Nb, : array of nodes ; 


begin S, := Ø ; 
forall v € V do 
ifv=u 
then begin D,[v] := 0 ; Nb„[v] := udef end 
else if v € Neigh, 
then begin D,,[v] := wu ; Nby[v] := v end 
else begin D, |v] := co ; Nb,[v] := udef end ; 
while S, 4 V do 
begin pick w from V \ Su ; 
(* Construct the tree Ty *) 
forall x € Neigh, do 
if Niu[w] = z then send (ys, w) to z 
else send (nys,w) to z ; 
num_rec, := 0 ; (* u must receive |Neigh,,| messages *) 
while num_rec, < |Neigh,,| do 
begin receive (ys, w) or (nys, w) message ; 
num_recy := num_rec, +1 


end ; 
if Du[w] < co then (* participate in pivot round *) 
begin if u # w 
then receive (dtab, w, D) fromthis Nb.,[w] ; 
forall x € Neigh, do 
if (ys, w) was received from z 
then send (dtab, w, D) toz ; 
forall v € V do (* local w-pivot *) 
if Dy[w] + D[v] < Dufu] then 
begin D,{v] := D,[w] + Dlx] ; 
Nobu |v] := Nb, fw) 
end 
end ; 
Su := Su U {w} 





图 4-6 Toueg 算 法 (节点 xu) 
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假设 权 值 (一 条 边 的 或 一 条 路 径 的 ) 和 节点 名 可 用 Ww 位 表示 ， 下 面 定 理 给 出 了 算法 的 复 
杂 度 。 

定理 4.9 ”图 4-6 所 示 的 算法 计算 每 一 对 节点 u、v 从 u 到 vy 的 距离 ， 如 果 距 离 是 有 限 的 ， 同 时 
计算 该 长 度 路 径 上 的 第 一 个 信道 。 算 法 中 ， 每 个 信道 交换 消息 为 OOIN)， 总 共 为 O(N'IEI) 条 消 
息 ， 每 一 信道 有 O(NW) 1, HHOMW) 位 ， 每 个 节点 的 存储 空间 为 O(NW)。 

证 明 。 可 从 图 4-5 所 示 的 算法 导出 图 4-6 所 示 的 算法 的 正确 性 。 

每 一 信道 可 携带 两 个 消息 <ys，w> (或 者 <nys，w>) (每 个 方向 各 有 一 个 ) ， 在 以 w 为 枢 轴 
节点 的 一 轮 循 环 中 ， 至 多 有 一 个 消息 <dtab，w，D> ， 因 此 每 个 信道 至 多 共有 3N 条 消息 。 消 息 
<ys，w> 或 者 <nys，w> 包 含 O(W) 位 ， 消 息 <dtab，w，D> 包 含 O(NW) 位 ， 这 给 出 了 每 个 信 
道 位 数 的 界限 。 因 此 至 多 交换 入 V 条 <dtab，w，D> 消 息 、2N-iEl 条 <ys ，w> 消 息 和 <nys ，w> 消 
息 ， 总 共有 O(N2NW + 2N-IEIW) = O(N3W) 位 。 在 节点 u 保 存 的 表 D, 和 Nb, 需 O(NW) 位 存储 
空间 。 口 

在 以 w 为 枢 轴 节点 的 一 轮 循环 中 ， 只 允许 节点 接收 和 处 理 那 一 轮 循环 中 的 消息 ， 即 ， 那 些 
携带 参数 w 的 消息 。 如 果 信 道 满足 fifo 的 性 质 ， 那 么 ，<ys，w> 和 <nys，w> 消 息 是 那 轮 开始 后 
首先 到 达 的 消息 ， 每 个 信道 一 个 消息 ， 而 <dtab，w，D> 消 息 是 下 一 个 由 Nb,[wj] 到 达 的 消息 
(如 果 节 点 在 V, 中 )。 如 果 信 道 是 fifo 的 ， 经 过 仔细 程序 设计 ， 可 以 省 上 略 所 有 消息 中 的 参数 w。 
如 果 信 道 不 是 fifo 的 ， 也 可 能 参数 为 w' 的 消息 到 达 时 ， 节 点 却 期 望 w 轮 中 的 消息 ， 这 里 w' 是 w 
之 后 的 枢 轴 节点 。 在 这 种 情况 下 ， 参 数 用 于 区 别 每 一 枢 轴 轮 中 的 消息 ， 因 此 必须 使 用 局 部 缓 
冲 区 (或 者 在 信道 中 或 者 在 节点 中 )， 来 推迟 处 理 w'- 消 息 。 

Toueg 给 出 了 优化 算法 ， 参 见 下 列 结果 。( 节点 ww 是 uw 的 后 代 ， 如 果 u 属 于 的 子 树 。) 

3184.10 ” 设 妇 关 w， 在 以 mw 为 枢 轴 节点 那 一 轮 循 环 的 开始 时 刻 ， 友 是 也 ,中 四 的 后 代 ， 如 果 
1 在 该 轮 中 改变 了 它 到 v 的 距离 ， 那 么 ， 在 该 办 中 四 也 改变 它 到 v 的 距离 。 

证 明 。 由 于 是 ww 的 后 代 (TT, 中 )， 


d*(u,,w) = d (wu) + d°(u,,w) (1) 
又 因为 zu ES, 

d°(u,,v) < dS (nm) + d°(u,,v) (2) 
注意 ， 在 该 轮 计算 中 ，w 改 变 D,[v]， 当 上 且 仅 当 

d*(u,,w) + d°(w,v) <d°(u,,v) (3) 
先 利 用 式 (2)， 然 后 利用 式 (1)， 再 减 去 必 (u, u), TA, 

d*(u,,w) + d°(w,v) < d°(u,,v) (4) 
这 表明 ， 在 本 轮 中 必 改 变 D, [v]. o 


按照 引 理 ， 图 4-6 所 示 的 算法 修改 如 下 。 在 接 到 路 由 表 D,。( 消息 <dtab，w，D>) 之 后 ， 
节点 u 首 先 执行 局 部 以 w 为 枢 轴 节点 的 操作 ， 然 后 将 路 由 表 转 发 给 它 在 T, 中 的 子 节点 。 在 转发 
表 的 过 程 中 ， 只 需 发 送 以 w 为 枢 轴 节点 的 计算 中 ,使 D,[v] 改 变 的 那些 D[v]， 经 过 修改 ， 在 每 一 
枢 轴 轮 之 间 (如 引 理 4.7 所 示 )， 以 及 枢 轴 轮 中 ， 路 由 表 是 无 回路 的 。 


4.23 讨论 以 及 更 多 算法 
Toueg 算 法 为 从 串 行 算法 到 分 布 式 算法 的 转换 提供 了 一 种 途径 。 因 此 ， 串 行 算法 中 变量 可 
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以 分 布 在 进程 中 ， 拥 有 变量 x* 的 进程 执行 对 变量 x (在 串 行 算法 中 ) 的 赋值 。 当 赋值 表达 式 包 
含 对 于 其 他 进程 变量 的 引用 时 ， 进 程 之 间 就 需 通 信 ， 以 便 传 输 该 变量 的 值 ， 并 同步 化 进程 。 
可 以 充分 利用 串 行 算法 的 特定 性 质 使 得 通信 时 间 最 小 化 。 

Toueg 算 法 简单 、 容 易 理 解 、 具 有 较 低 复杂 度 并 经 过 最 优 路 径路 由 。 它 的 主要 缺点 是 健壮 
性 不 好 。 当 网 络 拓扑 结构 发 生变 化 时 ， 整 个 计算 需要 重新 进行 。 此 外 ， 从 分 布 式 算法 工程 角 
度 来 看 ， 算 法 所 具有 的 两 个 性 质 也 使 得 它 缺 少 吸 引力 。 

第 一 , 通过 所 有 节点 统一 选择 下 一 个 枢 轴 节 点 (w) 要 求 预先 准确 地 知道 参加 节点 的 集合 。 
由 于 一 般 预 先 不 能 得 知 ， 因 此 在 执行 Toueg 算 法 之 前 ， 就 需要 执行 另外 一 个 分 布 式 算法 来 计算 
这 个 集合 (例如 ，Finn 算 法 ， 图 6-9 所 示 的 算法 )。 

第 二 ，Toueg 算 法 需要 反复 利用 三 角 不 等 式 4(4,，v) <d(u,，w)+d(w，v)。 节 点 u 对 该 不 
等 式 右 端 的 计算 需要 关于 d(w，v) 的 信息 ， 这 个 信息 一 般 是 远程 的 ， 即 ,无 论 是 x 中 还 是 它 
的 近邻 都 不 会 有 这 个 信息 。 对 远程 数据 的 依赖 需要 向 远程 节点 传输 信息 ， 这 一 点 可 在 Toueg 算 
法 中 看 到 (广播 部 分 )。 

作为 另 一 种 选择 ， 可 在 最 短路 径 问 题 的 算法 中 ， 利 用 以 下 所 定义 的 d U, y) 方 程 : 


d(u,v) 0 if u=v 
u,v) = . 
„in Ow tdw) a (4-1) 


该 方程 的 两 个 性 质 使 得 基于 它 的 算法 不 同 于 Toueg 算 法 。 

(1) 数据 局 部 性 。 为 了 计算 式 (4-1) 的 右边 ， 节 点 4 只 需要 局 部 信息 (on) 或 近邻 的 信 
息 ( 即 ，d(w,v))。 避 免 了 远程 节点 之 间 的 数据 传输 。 

(2) 目的 节点 独立 性 。 计 算 从 u 到 v 的 距离 只 需要 到 v 的 距离 ( 即 ，u 的 近邻 w 的 距离 4(w， 
v))。 因此， 到 一 个 固定 目的 节点 vo 的 所 有 距离 的 计算 ， 独立 于 到 其 他 节点 的 距离 的 计算 ， 因 
此 距离 的 计算 可 以 独立 进行 研究 。 

本 节 的 其 余部 分 ， 讨 论 了 基于 式 (4-1) 的 两 个 算法 。 即 ，Merlin- -Segall 和 Chandy-Misra 
算法 。 尽 管 这 些 算法 具有 数据 局 部 性 的 优点 ， 但 是 这 些 算法 的 通信 复杂 度 并 不 比 Toueg 算 法 的 
通信 复杂 度 有 所 改进 。 这 是 由 于 式 (4-1) 引入 的 目的 节点 独立 性 所 导致 。 显 然 ， 利 用 其 他 目 
的 节点 的 结果 〈 正 如 在 Toueg 算 法 中 所 做 的 那样 ) 要 比 引入 数据 局 部 性 效果 更 好 。 

如 果 不 能 导致 降低 通信 复杂 度 ， 那 么 数据 局 部 性 的 重要 性 又 在 哪里 ?如 果 网 络 拓扑 结构 
发 生变 化 《信道 和 节点 的 故障 或 者 修正 )， 数 据 能 够 变化 ， 则 对 远程 数据 的 依赖 要 求 后 者 不 断 
地 广播 。 达 到 这 些 广播 的 目标 (根据 广播 中 发 生 新 的 拓扑 结构 变化 的 可 能 性 )， 产生 了 代价 高 
昂 的 非 -平凡 问题 的 解决 方法 (参见 文献 [Gaf87])。 因 此 ， 基 于 式 (4-1) 的 算法 更 易于 处 理 拓 
扑 结构 易 变 的 网 络 。 在 4.3 节 作为 例子 ， 深 入 讨论 了 这 一 算法 。 

1. Merlin-Segall 算 法 

由 Merlin-Segall [MS79] 提 出 的 计算 每 一 目的 节点 路 由 表 的 算法 ， 可 以 完全 独立 地 运行 ; 
不 同 目的 节点 的 计算 互 不 影响 。 对 于 目的 节点 v， 算 法 开始 于 根 向 v 的 树 T,， 并 不 断 地 更 新 这 棵 
树 ， 最 终 使 得 该 树 成 为 目的 节点 为 v 的 最 优 汇集 树 。 

对 于 目的 节点 v， 每 一 节点 4 保持 到 v 的 距离 的 估算 值 D,[v]， 以 及 包 所 转发 的 节点 的 近邻 
Nbu[v1， 这 个 近邻 也 是 7, 中 的 父 节点 。 在 更 新 一 轮 中 ， 每 个 节点 x 将 计算 的 距离 D,[ 由 发送 到 人 除 
Nbslv] 的 所 有 近邻 中 (在 消息 <mydist，v，D,[v]> 中 )。 如 果 节 点 x 接 到 近邻 w 的 消息 <mydist， 
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v, d>, #tHd+o,,<D,lv], BA, Nb. (ve RAW, D, [y] 改 变 为 d + wu 。 节 点 v 控 制 更 新 
一 轮 的 计算 ， 并 要 求 每 个 信道 交换 两 条 W 位 的 消息 。 

文献 [MS79] 表 明 ， 更 新 ; 轮 后 ， 所 有 跳 数 至 多 为 :的 最 短路 径 已 经 正确 计算 。 因 此 ， 至 多 N 
轮 后 ， 就 能 计算 出 到 v 的 所 有 最 短路 人 径 。 可 以 为 每 个 目的 节点 独立 地 运行 算法 ， 计 算出 到 每 一 
目的 节点 的 最 短路 径 。 

定理 4.11 Merlin-Segall 计 算 最 短路 径路 由 表 的 算法 复杂 度 为 : 每 一 信道 交换 消息 的 复杂 
度 为 O(N?)， 每 一 信道 的 位 复杂 度 为 O(NV2.W)， 因 此 ， 算 法 的 消息 复杂 度 为 O(N2.IE1)， 位 复杂 
度 为 O(N?.iEIW )。 

算法 也 适合 于 网 络 拓扑 结构 和 信道 权 值 变化 的 情况 。 算 法 的 一 个 重要 性 质 是 在 更 新 一 轮 
的 过 程 中 ， 路 由 表 是 无 回路 的 。 

2. Chandy-Misra 算 法 

由 Chandy-Misra [CM82] 所 提出 的 计算 同一 目的 节点 的 所 有 最 短路 径 算 法 ， 利 用 了 扩散 计 
算 (diffusing computation )。 即 ， 一 种 分 布 式 计算 ， 由 一 个 节点 初始 化 ， 其 他 节点 一 接 到 消息 
后 就 加 入 。 

要 计算 所 有 节点 到 节点 vo 的 距离 ， 每 一 节点 4 从 D,[vo] = 开始 并 等 候 接收 消息 。 注 意 节 点 
vo 将 消息 <mydist，v。，0> 发 送 到 所 有 近邻 中 。 当 节点 u 接 到 近邻 w 的 消息 <mydist，vo。，d> 时 ， 
其 中 gd + wm <D,[vo] 时 ，u 将 d +, 赋 给 D,[vo]。 并 向 所 有 近邻 发 送 消 息 <mydist，vo，D,[vo]>。 
参见 图 4-7 所 示 的 算法 。 


var Du,fvo] : weight init oo ; 
Nb.,[vo] : node init udef ; 


For node vo only: 
begin D, [vo] := 0 ; 
forall w € Neigh,, do send (mydist, vo, 0) to w 
end 


Processing a (mydist, vo, d} message from neighbor w by u: 
{ (mydist, vo, d) € Muu } 
begin receive (mydist, vo, d) from w ; 
if d + wuw < Du[vo}) then 
begin Dy[vo] := d + wuw ; Nbu{vo] := w ; 
forall x € Neigh, do send (mydist, vo, Dlvo]) to z 


end 
+» 





图 4-7 Chandy-Misra 算 法 (4u) 


不 难 证 明 ，D,[vo] 总 是 d(w，vo) 的 上 界 ， 即 ， 由 算法 的 不 变 式 可 得 ，d(u， vo) < D,[vo] 成 
立 。 参 见习 题 4.3。 为 证 明 算法 计算 的 距离 正确 ， 必 须 证 明 最 终 达 到 的 一 个 配置 ， 在 这 个 配置 
中 ， 对 于 每 一 个 +，D,[vo] < d(w，vo) 也 成 立 。 在 弱 公 平 性 假设 的 前 提 下 ,证 明了 这 一 性 质 。 
即 ， 在 每 次 计算 中 最 终 都 会 所 收 到 发 送 的 每 条 消息 。 如 果 不 做 这 一 假设 ， 证 明 相当 复杂 。 


定理 4.12 在 图 4-7 所 示 的 算法 的 每 次 计算 中 ， 都 达到 一 个 配置 ， 在 该 配置 中 ， 对 于 每 一 
$ Su, 满足 D,[vo] gd(u， yo)。 
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证 明 。 固 定 v 的 一 棵 最 优 汇集 树 T， 对 除 vo 之 外 的 节点 编号 v1.…vw-!， 按 照 以 下 方式 ， 如 果 
yi 是 v 的 父 节点 ， 那 么 i < j。 设 C 是 一 次 计算 ， 可 以 对 /用 归纳 法 证 明 : 对 于 每 个 j< N-1， 达 到 
一 个 配置 ， 在 配置 中 ， 对 于 每 个 ! <j, Dy, [ww] < d(w，w)。 由 算法 可 见 ，D,[w] 从 不 增加 。 
因此 ， 如 果 D, [vol < d(v;:，vo) 在 某 些 配置 中 成 立 ， 则 它 在 后 面 的 所 有 配置 中 也 成 立 。 

情形 j = 0: vo 执行 完 初始 化 后 ，d (vo. vo) = 0; D, [vo] = 0; 因此， 算法 执行 后 ，D, [vo] 
< d (vo, vo) 成 立 。 

情形 j +1: 假设 达到 某 一 配置 ， 其 中 对 于 每 个 :<j，D, [vo] < d(v;，vo)， 并 考虑 节点 vin。 
Mj: Bll vo, 存在 一 条 长 为 d (vin, vo) 的 最 短路 径 vj,， Vis see Vos 其 中 v 是 7 中 wii 的 父 节 点 ， 
因此 ，i<j。 由 归纳 假设 ， 达 到 配置 时 D,[yo] < d(v;，vo)。 无 论 何 时 D,[vo] 下降 ，v; 都 将 消息 
<mydist, vo, D,[vo]> 发 送 至 近邻 ， 因此 ，d< d(v;，vo) 的 消息 <mydist，vo， d> 被 发 送 到 vj,) 
至 少 一 次 。 

根据 假设 ， 在 C 中 ， 由 v1 接收 消息 。 算 法 获 含 接 到 消息 后 ，D, [yo sd +o, vR. Hi 
的 选取 ， 可 得 d +O, Yi Sd( Vais Vo)o E 

与 4.3.3 节 开始 部 分 有 关 变 更 算法 的 评述 相 比 ， 完 整 算法 还 包括 一 个 机 制 ， 通 过 该 机 制 ， 
节点 能 够 检测 出 计算 是 否 已 经 完成 。 检 测 计 算是 否 完成 的 机 制 在 8.2.1 节 讨论 ， 这 是 一 种 
Dijkstra-Scholten 算 法 的 变形 。 

该 算法 与 Merlin-Segall 算 法 存在 两 点 不 同 之 处 。 第 一 ， 不 存在 节点 的 父 节点 ， 该 节点 被 
期 望 发 送 类 型 <mydist，.，.> 的 消息 。 即 使 是 在 计算 中 和 网 络 拓扑 结构 改变 时 ，Merlin-Segall 
算法 的 这 种 性 质 也 总 是 可 以 保证 路 由 表 是 无 回路 的 。 第 二 ，<mydist，.，.> 消 息 交 换 不 必 按 照 
轮 数 协调 ， 完 全 任意 发 生 。 这 对 算法 的 复杂 度 是 不 利 的 。 对 于 某 一 目的 节点 wm， 算法 需要 指 
数 级 的 消息 数 计算 到 某 个 目的 节点 w 的 路 径 。 如 果 假 设 所 有 信道 代价 相同 (BN, SRB 
数 路 由 算法 )， 到 vo 的 所 有 最 短路 径 利用 O(N-IEI) 条 消息 ， 每 条 消息 O(W) 位 进行 计算 ， 则 得 
以 下 结果 。 

定理 4.13 Chandy-Misra 算 法 计算 最 小 跳 数 路 由 表 的 算法 复杂 度 为 : 每 一 信道 交换 消息 复 
杂 度 为 O(N?)， 每 一 信道 位 复杂 度 为 O(N2-W)， 算 法 消息 复杂 度 为 O(N?-IE1)， 位 复杂 度 为 
O( NEI: W). 

较 之 Merlin-Segall 算 法 ，Chandy-Misra 算 法 的 优点 在 于 它 的 简明 性 ， 具 有 更 小 的 空间 复杂 
度 和 更 低 的 时 间 复杂 度 。 


4.3 变更 算法 


按照 最 小 跳 数 度量 ，Tajibnapis 提 出 的 计算 路 由 表 的 变更 算法 [Taj77] 是 最 优 的。 算法 可 与 
Chandy-Misra 算 法 做 比较 ， 它 保存 一 些 附加 信息 ， 使 得 在 信道 发 生 故 障 或 者 修复 时 ， 只 做 部 
分 重新 计算 就 能 完成 对 路 由 表 的 更 新 。 算 法 沿用 文献 Lamport[Lam82] 中 的 表示 。 算 法 依赖 以 
下 假设 。 

NI 节点 知道 网 络 规模 (N)。 

N2 信道 满足 fifo 假 设 。 

N3 节点 被 通知 关于 其 近邻 节点 的 故障 和 修复 情况 。 

N4 路 径 的 代价 等 于 路 径 上 信道 的 数目 。 

算法 能 够 处 理 信道 故障 、 修 复 信道 ， 还 可 以 增加 信道 ， 但 假设 近邻 信道 发 生 故 障 或 者 正 
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在 修复 时 ， 节 点 可 以 得 知 这 种 情况 。 因 此 不 考虑 节点 故障 或 者 恢复 的 情况 ， 而 是 假设 当 连 接 
节点 的 信道 发 生 故障 时 ， 近 邻 可 以 得 知 节点 的 故障 。 算 法 在 每 个 节点 zx 中 维持 一 张 表 Nb,. [v], 
对 于 每 个 目的 节点 v， 该 表 给 出 了 u 的 近邻，v 的 包 将 向 其 转发 。 不 能 要 求 在 任意 情况 下 ， 这 些 
表 的 计算 ， 都 能 在 有 限 步 内 终止 。 因 为 反复 的 信道 故障 和 修复 可 能 需要 无 限 的 重 计算 。 算 法 
要 求 如 下 。 
R1 如 果 在 有 限 次 的 网 络 拓扑 结构 变化 之 后 ， 网 络 拓 扑 结 构 保 持 为 常数 ， 那 么 算法 在 有 
限 步 后 终止 。 
R2 当 算 法 终止 时 ， 表 Nb, [v] 满 足 : 
a) 如 果 v=&， 那 么 ，Nb,[v] = local; 
b) 如 果 从 到” (+u) 的 路 径 存在 ， 那 么 ，Nb, [v] = mw， 其 中 w 是 从 x 到 v 的 最 短路 径 上 ， 
& 的 第 一 个 近邻 。 
c) 如 果 从 u 到 v 不 存在 路 径 ， 那 么 ，Nb, [v] = udef。 


var Neigh, : set of nodes ; (* The neighbors of u *) 
u : array of 0.. N; (* D,[v] estimates d(u, v) *) 
Nb, : array of nodes; (* Nb,[v] is preferred neighbor for v *) 
ndisy, : array of 0.. N;  (* ndis,[w, v] estimates d(w, v) *) 


Initialization: 
begin forall w € Neigh,, v EV do ndis,,[w, v] := N ; 
forall v € V do 
begin D,[v] := N ; Nbu[v] := udef end ; 
Dafu] := 0 ; Nb,[u] := local ; 
forall w € Neigh, do send (mydist,u,0) to w 


end 


Procedure Recompute (v): 
begin if v= u 
then begin D,,[v] := 0 ; Nb,,[v] := local end 
else begin (* Estimate distance to v *) 
d:=1+min{ndis,[w, v] : w € Neigh,} ; 
if d < N then 
begin D,,[v] :=d ; 
Nb, [v] := w with 1 + ndisy[w, v] = d 
end 
else begin D,[v] := N ; Nb,[v] := udef end 
end ; 
if D,|v] has changed then 
a forall z € Neigh, do send (mydist, v, Dy [v]) to x 
en 





图 4-8 变更 算法 (第 一 部 分 ， 节 点 x) 


4.3.1 算法 描述 
图 4-8 和 图 4-9 所 示 的 算法 给 出 了 Tajibnapis 的 变更 算法 。 通 过 非 形式 地 描述 算法 中 的 一 些 


操作 ， 及 随后 严格 证 明 算法 的 正确 性 。 考 虑 到 表述 的 直观 ， 对 拓扑 结构 变化 的 模拟 可 以 简化 
如 同 [Lam82]， 假 设 可 以 同时 处 理 受 影响 的 两 节点 中 的 变化 的 通知 。4.3.3 节 讨论 了 如 何 处 理 这 
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些 异步 通知 。 


Processing a (mydist,v,d) message from neighbor w: 
{ A (mydist,v,d) is at the head of Quy } 
begin receive (mydist,v,d) from w ; 

ndis,[w, v) := d ; Recompute (v) 


end 


Upon failure of channel uw: 
begin receive (fail, w) ; Neigh, := Neigh, \ {w} ; 
forall v € V do Recompute (v) 
end 


Upon repair of channel uw: 
begin receive (repair, w) ; Neigh, := Neigh, U {w} ; 
forall v € V do 
begin ndis,[w, v] := 
send (mydist,v v, D ulv] ) to 
end 





图 4-9 VERE (BR, PAu) 


基于 对 每 个 节点 到 目的 节点 * 的 距离 的 估算 ， 选 择 一 个 近邻 节点 ， 目 的 节点 为 "的 包 将 向 
其 转发 。 总 是 选择 具有 最 小 估算 距离 的 近邻 节点 。 对 于 u 的 每 个 近邻 w， 节 点 4 维持 对 d (4，v) 
的 估算 D,[v]， 并 且 ， 对 于 4 的 每 个 近邻 w， 估 算 d(w，v) 的 ndis,[w，v]。 由 ndis,tw，] 估 算 值 
计算 出 估算 值 D,[y]， 经 过 与 近邻 的 通信 可 得 mdis[w， 估算 值 。 

估算 D,[v] 的 计算 过 程 如 下 。 如 果 v =u, WA, dlu, v) = 0， 因 此 ，D,[y] = 0。 如 果 u*vy， 
那么 ， 从 u 到 v 的 最 短路 径 ( 如果 路 径 存 在 ) 由 从 u 到 近邻 与 从 近邻 到 v 的 最 短路 径 连接 而 成 ， 
因此 ， 


d(u,v) =1+ min d(w,v) 。 


由 此 方程 ， 当 节点 &#*v 时 ， 通 过 将 本 方程 用 于 已 经 计算 出 的 d(w，y) ( 表 中 为 ndis,[w，, 可 ) 
来 计算 4(u,，v)。 因 有 N 个 节点 ， 最 小 跳 数 路 径 长 度 为 至 多 为 N-1。 如 果 计 算 的 距离 为 N 或 者 
更 大 ， 则 可 怀疑 该 路 径 不 存在 。 表 中 的 N 用 于 表示 这 种 情况 。 

算法 要 求 节点 计算 它 的 近邻 到 v 的 距离 。 因 为 它们 在 消息 <mydist ,. ,. > 中 通信 ， 所 以 这 
些 信息 可 以 从 这 些 节 点 得 到 。 如 果 节 点 u 计 算出 它 到 vy 的 距离 4( D,Ly] = d)。 就 将 这 一 信息 放 入 
消息 <mydist，v，d > 中 ， 并 发 送 到 x 的 所 有 近邻 中 。 节 点 wu 一旦 接 到 近邻 w 的 消息 <mydist,，v， 
4d >， 就 将 值 4 峰 给 ndis,fw，v]。 由 于 ndis,[w，v] 的 值 改 变 时 ，u 的 计算 d (u, v) 也 要 改变 , F 
是 ， 每 当 ndis, 表 发 生变 化 时 ， 就 要 重新 计算 d(w，v) 的 值 。 如 果 该 值 确实 改变 ， 比 如 为 4'， 
就 要 利用 消息 <mydist，v，d' > 与 近邻 通信 。 

对 于 信道 故障 和 修复 ， 算 法 通过 修改 局 部 路 由 表 对 此 做 出 反应 ， 如 果 距 离 估算 发 生 改 变 ， 
就 发 送 消息 <mydist，.，.>。 假 设 节点 接 到 关于 信道 好 坏 (假设 N3) 的 通知 ， 通 知 形式 为 
<fail ，.> 和 <repair，.> 的 消息 。 用 两 队列 模拟 节点 wu 和 ws 之 间 的 信道 。8,1。, 表 示 从 ww 到 w, 的 消 
息 ，Q6, 表 示 从 ws 到 wu 的 消息 。 当 信道 发 生 故 障 时 ， 就 从 配置 中 删除 这 些 队 列 (这 引起 在 两 队 
列 中 的 所 有 消息 丢失 )， 且 在 信道 两 端的 节点 接收 消息 <fail，.> 消 息 。 如 果 w 和 wy 之 间 的 信道 
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RA, M AKA Efail, o>, WT Ae E <fa, u>. MEERA (R 
者 向 网 络 增加 新 信道 ), 在 配置 中 增加 两 个 空 队列 , 信道 连接 的 两 节点 间接 收 消息 <repair，>。 
如 果 志 和 uw 之 间 出 现 信道 ， 则 ww 接收 消息 <repair ，uz>， 而 节点 4 接收 消息 <repair，ui>。 

算法 对 于 故障 和 修复 的 响应 如 下 。 当 u 和 w 之 间 的 信道 发 生 故 障 时 ， 从 Neigh, 中 删除 w。 
到 每 个 目的 节点 的 距离 需 重新 估算 。 如 果 距 离 改 变 ， 就 要 将 结果 发 送 到 其 他 所 有 近邻 中 。 如 
果 以 前 的 最 佳 路 由 经 过 故障 信道 ， 且 没有 其 他 近邻 w'， 满 足 ndis, [w', v] = ndis, [w，v]。 当 
言 道 被 修复 时 (或 者 增加 新 的 信道 )， 将 w 加 入 Neigh, 中 ,但 是 还 没有 计算 d(w，v) 的 距离 
(反之 亦 然 )。 新 的 近邻 w 立 即 被 告知 所 有 到 目的 节点 v 的 距离 D, [v] (通过 发 送 消息 <mydist， 
v，D,[v]>)。 直 到 u 接 到 来 自 w 的 类 似 消 息 。u 利 用 N 作 为 4(w，v) 的 估算 值 ， 即 ， 设 ndis,[w， 
v] 为 N。 

变更 算法 的 不 变 式 ”我 们 要 证 明 许 多 断言 都 是 不 变 式 。 图 4-10 中 给 出 了 这 些 断言 。 断 言 
Plu, w, v) 阐明 ， 如 果 u 已 经 处 理 完 来 自 w 的 消息 <mydist，v，.>， 那 么 ，u 对 d(w, v) 的 估 
算 等 于 w 对 d(w，v) 的 估算 。 设 谓词 wp(u，w) 为 真 ， 当 且 仅 当 w 和 w 之 间 的 (双向) 信道 存在 ， 
且 正 在 工作 。 断 言 上 (xz，y) 表明 ，u 的 估算 d(u,，v) 总 是 与 4 的 局 部 知识 一 致 。 因 而 ， 可 以 相 
应 地 设置 Nb, [v]。 


P(u, w, v) = 
up(u, w) <= w € Neigh, 
A up(u, w) A Qwu contains a ( mydist, v, d} message 
= the last such message satisfies d = Dy [u] 
A up(u, w) A Qwu contains no ( mydist, v, d} message 
=> ndis,[w, v] = Dy[v] 


L(u, v) 


u =v => (Dulv] = 0 A Nb [v] = local) 
A (u £v A Iw € Neigh, : ndis,[w, v] < N — 1 
=> (D, fv] =1 + amin ndisulw, v] = 1 + ndis,[Nb.[v], v)) 
wE Neigh, 
A (u £ v A Yw € Neigh, : ndisy[w, v] > N — 1) 
=> (D,[v] = N A Nb,[v] = udef) 





图 4-10 不 变 式 P (u, w, v) FAL (u, v) 


当 信 道中 没有 更 多 算法 的 消息 在 传输 时 ， 算 法 计算 终止 。 对 于 整个 系统 ， 这 些 配置 不 是 
终止 的 ， 这 是 因为 随 着 信道 发 生 故障 或 者 修复 (对 此 系统 必须 做 出 响应 )， 系 统计 算 可 能 稍 后 
继续 。 我 们 称 几乎 没有 消息 的 配置 是 稳定 的 (stable)， 并 定义 谓词 stable 如 下 。 

stable = Vu, w: up(u, w) 一 Qwm 没 有 包含 消息 <mydist，.，.>。 

假设 初始 时 ， 变 量 Neigh 正 确 地 反映 了 正在 工作 的 通信 信道 的 存在 性 ， 即 ， 式 (1) 初始 
时 成 立 。 为 证 明 断 言 的 不 变 式 ， 考 虑 三 种 类 型 的 转移 : 

(1) 收 到 消息 <mydist，.，.>。 假 设 整 个 代码 段 的 具有 执行 原子 性 ， 并 认为 是 一 次 转移 。 
注意 在 这 次 转移 中 ， 只 接 到 一 个 消息 ， 却 可 能 发 送 许多 消息 。 

(2) 当 信道 发 生 故 障 时 ， 信 道 两 端的 节点 处 理 消息 <fait，.>。 

(3) 当 信 道 发 生 修复 时 ， 两 个 连接 的 节点 处 理 消息 <repair，.>。 

引 理 4.14 对 于 所 有 uo、 wofevo, P(uo, wo, vo) 是 一 个 不 变 式 。 

证 明 。 初 始 时 ， 在 每 一 节点 初始 化 过 程 执 行 之 后 ， 由 假设 ， 式 (1) 成 立 。 初 始 时 如 果 
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“up (uo, Wo) 成 立 ， 则 式 (2) AA (3) 都 成 立 。 如 果 初 始 时 up (uo，、wo) 成 立 ， 则 ndiss fwo， 
vo] = N。 如 果 wo = vo, MD., [wo] = 0， 但 是 消息 <mydist，vo。，0> 在 队列 Qo 中 ， 因 此 式 (2) 
和 式 (3) 为 真 。 如 果 wo +v, MD. [vo] = N， 但 是 队列 中 没有 消息 ， 这 也 蕴含 着 式 (2) MR 
(3) 成 立 。 我 们 依次 考虑 上 述 的 三 种 类 型 的 状态 转移 。 

类 型 (1) ”假设 接收 w 的 消息 <mydist，v，d>。 这 种 情况 ， 不 会 引起 拓扑 结构 变化 ， 也 
不 会 引起 Neigh 和 集合 的 变化 。 因 此 式 (1) 依然 成 立 。 如 果 v vo。， 消 息 的 接收 不 会 改变 P (u, 


Wo, Vo)» 


息 <mydist，w，>， 则 消息 的 值 仍然 满足 式 (2)， 因 此 式 (2) 保持 。 式 (3) 保持 是 因为 它 的 前 
提 为 假 。 如 果 所 收 到 的 消息 是 信道 中 这 种 类 型 的 最 后 一 条 消息 ， 那 么 由 式 (2) 可 得 d = D,,[vol, 
RASER (3) 的 结论 变 为 真 ， 式 (3) 保持 。 此 时 式 (2) 的 前 提 变 为 假 ， 式 (2) 保持 。 

如 果 v = Vo. U= Wo (ww 是 4 的 近邻 )， 如 果 在 wo 中 执行 Recompute (v) i, BET D lvlt 
fi, WA, A (2) 和 式 (3) 可 能 为 假 。 这 种 情况 下 ， 具 有 新 值 的 消息 <mydist，w，.> 向 uo 
RS. KARERA (3) 的 前 提 为 假 ， 式 (2) 的 结论 变 为 真 ， 因 此 式 (2) 和 式 (3) 保持 。 
这 是 把 消息 <mydist，w，.> 加 入 队列 C.wo 中 的 惟一 一 种 情况 。 总 是 满足 d = D。 [vo]。 

如 果 v = volu *uo, WotEP( Uo, Wo, vo) 中 不 会 改变 。 

类 型 (2) 假设 信道 ww 发 生 故 障 。 

如 果 u = wo 和 w = wo，、 这 个 故障 使 得 式 (2) 和 式 (3) 的 前 提 为 假 ， 因 此 式 (2) 和 式 (3) 保持 。 
A (1) 保持 是 因为 wo 被 从 Neigh, 中 删除 ， 反 之 亦 然 。 如 果 u = wo 和 w = uo， 同 样 情况 发 生 。 

如 果 u = wo， 但 是 wx#m， 由 于 Du.。 [w] 的 值 发 生 改 变 ， 所 以 式 (2) MA (3) 的 结论 可 能 
为 假 。 这 种 情况 下 ， 由 wo 所 发 送 的 消息 <mydist，w，.> 再 次 使 得 式 (3) 的 前 提 为 假 。 这 使 得 
A (2) 的 结论 为 真 ， 因 此 式 (2) 和 式 (3) 保持 。 

在 所 有 其 他 情况 下 ，P(w。，wo。，vo) 未 有 任何 变化 。 

类 型 (3) ”假设 增加 信道 ww。 

如 果 x = wo 和 w = wo， 这 使 得 wp( uo, wo) 为 真 ， 但 是 将 wo 加 入 Neigh。 (反之 亦 然 ) 保持 式 
(1). 

由 wo 所 发 送 的 消息 <mydist，v。，D,o[vo]> 使 得 式 (2) HH, 式 (3) 的 前 提 为 假 ， 因 此 P 
(uo, Wo, vo) 被 保持 。 

在 所 有 其 他 情况 下 ，P(u。，wo，vo) 没有 发 生变 化 。 口 

引 理 4.15 对 于 每 一 Wo 和 vo， L (uo, vo) 是 一 个 不 变 式 。 

证 明 。 初 始 时 Du [uo] = 0 和 Nb [uo] = local. 2t Fvo* uo， 初始 时 ， 对 于 所 有 w E Neigh., 
ndisulw，vo] =N, FH D, [vo] = NAIND,.[v0] = udef. 

类 型 (1) Pikudie wh B<mydist, v, d>. MM Ruruy, RHvev, L(uo, vo) 中 没 
有 变量 改变 。 如 果 u =u. v=vo, Hndis,[w, vol MABE, 需 重新 准确 计算 Ds [vol FIND, [vo], 
满足 L( uo, Vo)。 

类 型 (2) ”假设 信道 ww 发 生 故 障 。 

如 果 x = uo 或 w = uy, AA, Neigh, BX 需 再 次 重新 准确 计算 D。 [vo 和 Nb [vo], 以 满足 
L( uo, Vo) 。 

类 型 (3) ”假设 增加 信道 4w。 


如 果 v = ww、u = wo 和 w = Wo, ndis, [wo，vo] 的 值 可 能 发 生变 化 。 然 而 ， 如 果 信 道中 仍 有 另 一 消 
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如 果 z = uo, 那么 ， 由 于 增加 w 使 得 Neigh, 改变 ， {H H Fuit Endis, [w, vo] 值 为 N， 这 使 
L (uo, vo) 保持 。 口 


4.3.2 变更 算法 的 正确 性 


现在 将 要 证 明 算法 的 两 个 正确 性 要 求 。 

定理 4.16 当 达 到 稳定 配置 时 ， 路 由 表 Nb,fv] 满 足 : 

(1) 如 果 U=v， 那 么 Nbp, [v] = local; 

(2) 如 果 存 在 从 U 到 v 关 4 的 路 径 ， 那 么 ，Nbs[v] = w， 其 中 w 是 从 u 到 Vv 的 最 短路 径 上 u 的 第 
一 个 近 和 邻 ; 

(3) toRMus| vHBRRAA, M2, Nb, [v] = udef。 

证 明 。 当 算法 终止 时 ， 对 于 所 有 u、v 和 w， 谓 词 P(w,，w，v) 及 谓词 stable 都 成 立 。 这 草 
含 着 ， 对 于 所 有 uw、v 和 和 w， 


up(u,w) => ndis,[w,v] = D,[v] 。 (4-2) . 
对 于 所 有 uw 和 v， 再 次 应 用 L(u，v) 可 得 
0 if u=yv (4.3) 


Div] = 1+ min D,[v] if uxvadwENeigh, : D [v]<N-1 
if u = v a Ww ENeigh, : D,[v] > N-1 
如 果 w 和 "在 网 络 的 同一 连通 分 量 中 ， 则 证 明 D.[v] = dlu, v) 就 足够 了 。 如 果 u 和 v 在 网 络 
的 不 同 连通 分 量 中 ， 则 需 证 明 D. [v] = N。 
首先 对 d(u，v) 用 归纳 法 证 明 ， 如 果 u 和 v 在 同一 连通 分 量 中 ， 则 D, [v] <d(u, v). 
fi@d(u, v) =0: 这 隐 含 着 4 =v， 因 此 ,，D, [y] = 0。 
情形 d(w，”) =k+1: 这 蕴含 着 存在 节点 w E Neigh,Ad(w, v) =k， 由 归纳 假设 D,[v] <k, 
由 式 (4-3), xB BD, [vy] < k+l. 
现在 对 Dlv] 用 归纳 法 证 明 ， 如 果 D,[v] < N， 那 么 ， 在 w 和 v 之 间 存 在 路 径 ， 且 d(u, v) < 
D, [v]. 
情形 D,[v] = 0: R (4-3) M&M yu = vtt, Div] = 0。 这 表明 wu 和 v 之 间 的 路 径 为 空 ， 且 
d(u, v) =0, 
情形 Div] =k +1 <N: 式 (4-3) 蕴含 ， 存 在 节点 w E Neigh, HD,[v] = k。 由 归纳 假设 ， 
和 "之 间 存 在 路 径 ， Hd(w, v) 《天 ， 这 蕴含 着 wx 和 "之 间 存 在 路 径 ， 且 d(z，v) <K+1， 
由 此 可 得 ， 如 果 w 和 "在 同一 连通 分 量 中 ， 那 么 D.[y] = dlu, v), BA, Ddv]=N, È (4- 
2) RH, Vu, v: L(u, v) BA BMRA END, [v] 的 结果 。 口 
为 证 明 如 果 拓 扑 结 构 不 再 变化 ， 算 法 最 终 达 到 稳定 情形 ， 定 义 关于 stable 的 范 函 数 。 对 于 
算法 的 配置 y， 定 义 


i= (消息 <mydist，..， 记 的 数目 ) + (ED, [v] = 有 的 序 对 4，v 的 个 数 。) 
和 函数 
f(y) = (tos thy ..., ty) 
fly) 是 自然 数 的 (N +1) 元 组 ， 并 假设 字典 有 序 (用 < 表示 )。 回忆 (N, <) 是 一 
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良 基 集 (习题 2.5)。 

引 理 4.17 消息 <mydist，.，.> 的 处 理 使 得 /递减 。 

A. BREDI] = di 的 节点 u 收 到 消息 <mydist,，v，4d;>， 重新 计算 之 后 ，D,[v] 的 新 值 为 d。 
算法 蕴含 d< dAl. 

如 果 d < di: d = ds+1， 这 蕴含 着 ，ts, 按 照 1 递减 (ts 也 按照 1 递减 )， 并 且 只 有 d > ds 时 ts 增 
加 。 这 表明 /的 值 递减 。 ; 

如 果 d = di: u 不 发 送 任何 新 的 消息 <mydist，.，.>， 惟 一 对 /产生 影响 的 是 ia, 按照 1 递减 ， 
因此 ,的 值 递减 。 

如 果 d > dy: ta PARE (tH), AA Md > dt, a, REAM 
减 。 . o 

定理 4.18 ”在 经 过 有 限 次 变化 之 后 ， 如 果 网 络 的 拓扑 结构 不 再 变化 ,那么 算法 在 有 限 步 
后 达到 稳定 配置 。 

证 明 。 如 果 只 有 消息 zmydist，.，.> 的 处 理 ， 而 网 络 拓 扑 结 构 保 持 ， 由 前 述 引 理 可 得 ， 每 
次 转移 ，f 的 值 递 碱 。 由 f 域 的 良 基 性 ， 只 能 发 生 有 限 次 的 转移 ， 因 此 算法 在 有 限 步 后 达到 稳定 
配置 。 口 


43.3 算法 讨论 


算法 的 正确 性 保证 ， 经 过 最 终 拓 扑 变化 之 后 ， 在 有 限时 间 内 算法 收敛 到 正确 的 路 由 表 。 
这 并 不 是 算法 实际 的 行为 。 谓 词 stable 可 能 在 实际 中 的 大 部 分 时 间 为 假 ( 即 ， 如 果 拓 扑 变化 频 
繁 ) ， 当 stable 为 假 时 ， 我 们 对 路 由 表 一 无 所 知 。 它 们 可 能 包含 回路 ， 或 者 给 出 关于 目的 节点 
可 达 性 的 错误 信息 。 因 此 算法 只 适合 于 拓扑 结构 不 常 变化 的 应 用 ， 与 拓扑 结构 突变 之 间 的 平 
均 时 间 相 比 ， 算 法 的 收敛 时 间 较 小 。 这 是 由 于 stable 是 全 局 性 质 ， 节 点 难以 区 别 算法 的 稳定 配 
置 和 非 稳定 配置 。 这 意味 着 ， 节 点 不 知道 它 的 路 由 表 是 否 正确 地 反映 了 网 络 的 拓扑 结构 ， 并 
且 ， 在 达到 稳定 配置 之 前 ， 不 能 推迟 对 于 数据 包 的 转发 。 

1. 异步 处 理 通知 

本 节 已 经 假设 ， 拓 扑 结构 变化 的 通知 可 随 着 一 次 转移 中 的 变化 自动 处 理 。 处 理 在 被 删除 
(或 被 增加 ) 的 信道 的 两 边 同 时 进行 。Lamport[Lam82] 更 详细 地 进行 了 分 析 ， 并 人 允许 在 处 理 这 
些 通知 时 有 一 个 延 时 。 从 w 到 x 的 通信 信道 用 三 个 队列 的 连接 进行 模拟 。 

(1) 00.，w 的 输出 队列 。 

(2) 7C@， 当 前 正 被 传输 的 消息 队列 (数据 包 )。 

(3) 10,.，u 的 输入 队列 。 

在 信道 的 正常 操作 下 ，w 通 过 向 队列 OQ,. 追 加 消息 向 发 送 消息 ， 然 后 消息 从 队列 OO, 移 
到 队列 7T@， 再 从 队列 7TQ, 移 到 队列 12.，zx 通 过 从 队列 1C, ,中 删除 消息 来 接收 消息 。 当 信道 
发 生 故 障 时 ， 则 丢弃 队列 TO 中 的 消息 ， 队 列 OC,. 中 的 消息 也 随 之 于 弃 ， 而 不 是 将 其 追加 到 
队列 7T@ 中 。 消 息 <faiLl，w> 被 放 在 队列 1C,. 尾 ， 当 恢复 正常 操作 时 ， 消 息 <repair，w> 被 放 在 
队列 12, 尾部。 谓词 P(&，w，v) 具有 稍微 复杂 的 形式 ， 但 算法 不 变 。 

2. 最 短路 径路 由 

可 能 为 每 一 信道 赋 以 权 值 ， 并 修改 算法 来 计算 最 短路 径 ， 而 不 是 最 小 跳 数 路 径 。 在 变更 
算法 的 Recompute 过 程 中 ， 如 果 用 ww 代替 常数 1， 在 估算 经 过 w 的 最 短路 径 长 度 时 ， 就 要 考虑 
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言 道 ww 上 的 权 值 。 用 网 络 直径 的 上 限 代 替 算 法 中 的 常数 N。 

容易 证 明 ， 当 修改 的 算法 达到 稳定 配置 时 ， 路 由 表 是 正确 的 ， 并 给 出 最 优 路 径 ( 网 络 中 
的 所 有 回路 必须 具有 正 权 值 )。 算 法 最 终 达到 这 样 配置 的 证 明 需 要 更 复杂 的 范 孙 数 。 

可 以 对 算法 进行 扩充 ， 使 其 可 以 处 理 变化 的 信道 权 值 ， 节 点 u 对 信道 权 值 变化 的 反应 是 重 
新 计算 所 有 v 的 Ds[v]。 与 收敛 时 间 相 比 ， 信 道 代价 变化 之 间 的 平均 时 间 很 大 时 ， 算 法 才 有 实际 
意义 ， 然 而 ， 这 是 不 切实 际 的 假设 。 在 这 些 情况 下 ， 希望 算法 在 收敛 过 程 中 无 回路 ， 如 
Merlin-Segall 算 法 。 


44 带 有 压缩 路 由 表 的 路 由 


到 目前 为 止 ， 所 讨论 的 路 由 算法 都 要 求 各 节点 维持 一 张 带 有 各 自 可 能 目的 节点 分 开 表 项 
的 路 由 表 。 当 需要 通过 网 络 转发 包 时 ， 就 要 访问 路 径 上 各 节点 的 这 些 路 由 表 ( 除 目的 节点 外 )。 
本 节 研 究 路 由 表 的 组 织 结构 ， 以 降低 路 由 表 的 存储 空间 和 查找 开销 。 这 里 不 考虑 分 布 式 算法 
如 何 计算 这 些 路 由 表 。 为 简化 表示 ， 在 本 节 中 ， 假 设 网 络 都 是 连通 的 。 

本 节 所 讨论 的 在 三 种 路 由 机 制 中 获得 更 小 路 由 表 的 策略 ， 可 以 解释 如 下 。 如 果 节 点 的 路 
由 表 分 开 存 储 每 一 目的 节点 的 输出 信道 ， 路 由 表 表 长 必须 为 N， 无 论 如 何 对 输出 信道 进行 压缩 
编码 ， 路 由 表 要 求 2(V) 位 的 空间 。 现 在 考虑 路 由 表 的 重组 ， 其 中 路 由 表 包 含 节点 信道 的 表 项 ， 
告知 哪些 目的 节点 要 经 过 此 信道 路 由 。 和 参见 图 4-11。 对 于 有 deg 个 信道 的 节点 ， 表 长 为 deg， 
在 存储 空间 上 的 实际 节省 ， 取 决 于 如 何 能 压缩 地 表示 每 个 信道 目的 节点 集合 。 为 保证 查找 的 
效率 ， 对 于 给 定 的 目的 节点 ， 所 构造 的 路 由 表 要 能 快速 检索 出 其 输出 信道 。 


Wy 


destinations 
Wy 






Wa wz 





w3 
图 4-11 碱 小 路 由 表 的 大 小 
4.4.1 树 标号 模式 


Santoro 和 Khatib 提 出 了 第 一 个 压缩 路 由 方法 [SK85]。 该 方法 基于 对 节点 用 0 到 N-1 的 整数 
进行 标号 ， 按 照 这 种 方法 ， 每 一 信道 的 目的 节点 集合 为 一 个 区 间 。 令 Zw 表示 集合 {0，1，.， 
N-1}。 在 本 节 中 ， 和 集合 中 的 所 有 计算 以 N 为 模 。 例 如 ，(N-1)+ 1= 0， 序 号 和 在 Z 中 的 一 样 。 

定义 4.19 MRENA [a,b) 是 Zw 中 如 下 定义 的 整数 集合 


{a,a+1,---,b-1} 如 果 a <b 
[a,b) o E ZN ina >b 


HR, la, a)= Zy, Faxed, [a, b) 的 补 集 是 [5b, a), WRa<b, AAEN [a, b) 


定理 4.20 。 树 T 的 节点 可 以 按照 这 样 一 种 方式 编号 ， 使 得 对 于 每 一 节点 的 每 条 输出 信道 ， 
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必须 经 过 那个 信道 路 由 的 目的 节点 集合 是 循环 区 间 。 

证 明 。 任 取 节 点 wo 作为 树 根 ， 对 于 每 一 节点 w， 设 TTw] 表 示 以 w 为 根 的 7 的 子 树 。 可 能 按照 
这 样 一 种 方式 为 节点 编号 ， 使 得 对 于 每 个 节点 w，T[w] 中 节点 的 编号 形成 线性 区 间 ， 如 图 4-12 
中 按照 树 的 前 序 遍 历 编号 。 按 照 这 个 次 序 ，w 是 树 7[w] 中 第 一 个 被 访问 的 节点 ; 然后 ， 在 访问 
完 树 7[w] 中 的 所 有 节点 后 ， 才 能 访问 树 T[w] 之 外 节点 。 因 此 ，T[w] 中 的 节点 可 以 按照 线性 区 
间 [1,, QtITIwll) (4 是 w 的 标号 ) 编号 。 


Vo 


“ei, =0 


一 


lw = 加 十 位 四 ]| 





lz = by + (T[w}[ -1 


图 4-12 前 序 遍 历 树 


设 [aw, by) 表示 赋 给 树 7Tw] 中 结 点 编号 的 区 间 。w 的 近邻 或 者 是 它 的 子 节点 或 者 是 它 的 
父 节 点 。 节 点 w 向 它 的 子 节 点 wx 转 发 目的 节点 在 7 四 中 的 包 ， 即 ， 编 号 在 [a,, ba) 中 的 节点 。 
节点 w 向 它 的 父 节 点 转发 目的 节点 不 在 TIw] 中 的 包 ， 即 ， 节 点 编号 在 Zw\ lan bu) = [bu av) 
中 的 节点 。 口 
给 定 起 始点 和 结束 点 ， 只 利用 2logN 位 就 可 以 表示 一 个 循环 区 间 。 由 于 在 应 用 中 ， 必 须 存 
储 并 集 为 Zw 的 不 相交 区 间 的 集合 (把 x 加 入 到 节点 的 区 间 之 一 ), 每 个 区 间 有 logN 位 就 足够 了 。 
只 要 存储 与 每 个 信道 对 应 的 区 间 的 起 始点 ， 同 一 节点 对 应 区 间 的 结束 点 等 于 下 一 区 间 的 起 始 
点 。 与 节点 wu 的 信道 ww 对 应 的 区 间 起 始点 如 下 
l, 如果 w 是 u 的 子 节点 
w T {hs [Tu] | Anew ult 5245 A 
假设 用 ai ，.…，cues 对 度 为 deg, 的 节点 u 的 信道 进行 编号 ， 其 中 Qi<.…<awcs,。 图 4-13 所 示 
的 算法 给 出 了 转发 过 程 。 信 和 道 标号 把 集合 Zw 划分 成 deg, 段 ， 每 个 段 与 一 个 信道 对 应 。 如 图 4-14 
所 示 。 观察 可 见 ， 至 多 有 一 个 区 间 是 非 线 性 的 。 如 果 标 号 在 节点 处 排序 ， 利 用 折 半 查找 用 
O(log deg.) 步 就 能 找到 正确 标号 。 下 标 ;的 计算 为 模 deg,， 即 ，aur +1 = o. 





(* A packet with address d was received or generated at node u *) 
if d= 
then deliver the packet locally 
else begin select a; s.t. d € [ai ai41) ; 
send packet via the channel labeled with a; 







end 





图 4-13 区 间 转 发 算法 (节点 u) 
树 标号 模式 的 路 由 是 最 优 的 ， 因 为 在 树 中 每 两 个 节点 之 间 只 存在 一 条 简单 路 径 。 如 果 网 
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络 不 是 一 棵 树 ， 也 可 用 这 种 方法 。 选 择 网 络 的 一 棵 固定 生成 树 了 7， 将 树 标 号 模式 应 用 于 这 棵 生 
成 树 上 。 不 属于 这 棵 树 的 信道 从 不 使 用 ， 在 路 由 表 中 以 特殊 记号 表示 这 些 不 用 信道 ， 以 表明 





没有 包 经 过 此 信道 路 由 。 as :0 

为 比较 用 这 种 方法 选 出 的 路 径 长 度 与 最 : 
优 路 径 ， 设 dr (wu，v) RETH Suv ABE AS a (a a 
dolu, v) 表示 G 中 从 x 到 "的 距离 。 令 De 表示 

经 信道 a 路 由 Ha 

G 的 直径 ， 定 义 为 4 和 ?上 do(u，v) 的 最 大 wawis J T Eiai 
值 。 Qi Q2 

314.21 d (u, v) 和 dc (u,v) 之 间 图 4 14 一 个 节点 的 Zw 划分 


的 比率 不 存在 一 致 界限 。 在 以 跳 数 作为 路 径 度量 的 特殊 情况 下 已 经 成 立 。 

证 明 。 选 择 G 为 N 个 节点 的 环 ， 从 G 中 去 掉 一 条 信道 ， 如 xy， 则 得 G 的 一 棵 生成 树 。 现 在 ， 
dg(x, y) = 1 和 dr (x, y) = N-1， 因 此 ， 比 率 为 N-1。 通 过 选取 大 环 ， 这 个 比率 可 以 是 任意 
的 。 o 

以 下 引 理 依赖 信道 代价 的 对 称 性 ， 即 wu =w。，。 这 蕴含 着 对 于 所 有 u 和 v,，d6 (u,v) = 
do (v, u). 

引 理 4.22 可 以 按照 这 样 一 种 方式 选择 T[， 使 得 对 于 所 有 u 和 v， 满 足 dr (u, v)2Do. 

证 明 。 选 择 T 是 节点 wo 的 最 优 汇集 树 (如 在 定理 4.2 中 所 作 的 那样 )。 那 么 ， 

dr(u, v) <dr(u, wo) +dr (wo, v} 
=dr(u, wo) +dr(v, w) 由 ww 的 对 称 性 
=dg(u, Wo) +dg(v, wo) 由 T 的 选择 
< De + De 由 Do 的 定义 





口 

总 之 ， 与 两 个 相同 节点 之 间 的 最 优 路 径 相 比较 〈 引 理 4.21)， 用 这 种 方法 选择 的 路 径 会 任 
意 坏 ， 它 最 多 比 系统 中 其 他 两 节点 间 的 路 径 差 两 倍 。 这 表明 ， 这 种 方法 适合 于 通信 节点 之 间 
的 距离 为 8( De) 的 情况 。 如 果 节 点 闻 的 大 多 数 通 信 为 G 中 的 较 短 距离 ， 就 不 需 使 用 这 种 方法 。 

除了 所 选 路 径 长 度 的 因素 之 外 ， 树 路 由 模式 还 有 以 下 缺点 : 

(1) 不 能 使 用 不 属于 7 的 信道 ， 这 是 网 络 资源 的 一 种 浪费 。 

(2) 信息 量 集中 在 树 上 ， 容 易 引 起 拥塞 。 

(3) 7 中 的 每 一 条 信道 故障 ， 都 会 将 网 络 分 开 。 


4.4.2 区 间 路 由 


Van Leeuwen 和 Tan[LT87] 扩 充 了 树 标号 模式 到 非 树 的 网 络 ， 用 这 种 方法 ，( 几乎 ) 每 一 条 
信道 都 可 用 于 包 通 信 。 | 

定义 4.23 网络 的 区 间 标号 模式 (ILS) 是 

(1) 将 Zw 中 的 不 同 标号 赋 给 网 络 中 的 节点 ， 且 

(2) 对 于 每 一 个 节点 ， 将 Zw 中 的 不 同 标号 屿 给 那个 节点 的 各 个 信道 。 

在 区 间 路 由 中 ， 假 设 给 定 ILS， 包 的 转发 如 图 4-13 所 示 的 算法 。 

定义 4.24 如 果 按 区 间 标 号 模式 转发 的 所 有 包 最 终 到 达 其 目的 节点 ， 则 区 间 标 号 模式 是 
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有 效 的 。 

可 以 证 明 ， 对 于 每 一 连通 网 络 G， 存 在 有 效 的 区 间 标 号 模式 (定理 4.25)。 然 而 ， 对 于 任 
意 连通 网 络 ， 这 种 模式 通常 不 是 非常 有 效 的 。 在 证 明 存在 性 之 后 ， 研 究 通过 区 间 路 由 模式 选 
择 路 径 的 最 优 性 。 

定理 4.25 ”对 于 每 一 连通 网 络 G， 存 在 有 将 的 区 间 标 号 模式 。 

证 明 。 通 过 扩展 Santoro 和 Khatib 提 出 的 树 标号 模式 ， 构 造 有 效 的 区 间 标 号 模式 ， 并 应 用 
于 网 络 中 的 一 棵 生成 树 T。 给 定 一 棵 生成 树 非 树 边 (frond edge) 表示 不 属于 这 棵 生成 树 的 边 。 
v 是 wu 的 祖先 ， 当 且 仅 当 w E T[v]。 构 造 的 主要 问题 是 如 何 给 非 树 边 赋 标 号 ( 树 边 的 标号 如 同 
树 标号 模式 ) 。 用 这 样 一 种 方法 选择 生成 树 ， 以 致 于 所 有 非 树 边 取 一 种 限定 的 形式 ， 正 如 将 
要 表明 的 那样 。 137 

引 理 4.26 存在 生成 树 ， 满 足 所 有 非 树 边 介 于 节点 与 那个 节点 的 祖先 之 间 。 

证 明 。 用 深度 优先 搜索 对 网 络 进行 遍历 ， 得 到 的 生成 树 具有 引 理 所 述 的 性 质 。 参 见 文献 
[Tar72] 和 6.4 节 。 口 

设 T 是 一 棵 G 的 深度 优先 搜索 生成 树 。 

定义 4.27 G 的 深度 优先 搜索 ILS( 与 T 有 关 ) 是 满足 以 下 规则 的 标号 模式 。 

(1) 节点 按照 对 7 的 前 序 遍 历次 序 标号 ， 即 ， 子 树 T[w] 中 的 节点 用 [1,, Lawl) 中 的 数 
标号 。 记 kk, = 1, + 1TIw]l。 

(2) 节点 wu 的 边 4w 标 号 为 Qo。 

a) 如 果 uw 是 非 树 边 ， 那 么 Quw= lwo 

b) 如 果 w 是 4 的 子 节点 (7 中 )， 那 么 Qww= luo 

c) 如 果 w 是 4 的 父 节 上 点， 那么 Qw= 上。 除非 = N 且 ww 有 到 根 的 非 树 边 。 

(在 后 一 种 情况 下 ， 由 规则 (a) 对 非 树 边 标 以 0， 如 果 标 以 ， 则 会 违反 条 件 ， 即 4 的 所 有 
边 的 标号 不 同 。 标 号 以 N 为 模 ， 因 此 Na0。) 

(d) 如 果 w 是 u 的 父 节 点 ，w 有 到 根 的 非 树 边 ， 且 k=N， 那 么 Quw= ly. 

图 4-15 给 出 了 深度 优先 搜索 ILS 的 例子 。 其 中 所 有 非 树 边 按 照 规 则 (2a) 标号 ， 节 点 4、8 
和 10 的 父 节点 的 边 按照 规则 (2c) 标号 ， 节 点 9 的 父 节 点 的 边 按照 规则 (2d) 标号 。 








图 4-15 深度 优先 搜索 ILS 138 
可 以 证 明 ， 深 度 优先 搜索 ILS 是 有 效 的 模式 。 观 察 可 见 ，v € Tiu] eE [h k) UFE 


个 引 理 涉及 节点 x 向 节点 w (4 的 近邻 ) 转发 带 有 目的 节点 v 的 包 的 过 程 。 将 目的 节点 为 v 的 包 转 
发 给 节点 w。 这 冀 仿 着， 对 于 某 些 u 中 的 标号 a，1, Elam a)， 且 在 节点 u 中 ， 不 存在 标号 a'x 
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引 理 4.28 tRil,>1,, MA, <ho 

iA. FES Be, < 4 的 情形 。 节 点 w 不 是 4 的 子 节 点 ， 因 为 在 那 种 情况 下 ，cww= ly > lu> 
1,。 如 果 uw 是 非 树 边 ， 那 么 1, = a < h < 4。 如 果 节 点 w 是 u 的 父 节 点 ， 那 么 ,< 在 任何 情况 
下 都 成 立 。 其 次 ， 考 虑 a 是 4 中 具有 最 大 标号 的 边 ， 不 存在 标号 a'< 1，( 即 几 是非 线 性 区 间 的 
左边 部 分 )。 在 这 种 情况 下 ， 与 4 的 父 节 点 相连 的 边 标号 不 为 0， 而 为 &( 因为 0 <1, PEE 
标号 Qa' < 1,)。 标 号 是 这 种 情况 的 最 大 标号 ; 到 子 节点 的 边 或 者 向 下 的 非 树 边 w 满足 ww = lw 
<ko Hew PFE E Qw lw < hs。 因此 w 是 u 的 父 节 点 ， 这 至 含 着 !, < lo 口 

下 面 两 个 引 理 涉及 六 <1 的 情形 。 推 导出 或 者 v E Tu] REL? ko BAW, < NR 
立 。 因 此 到 wu 的 父 节 点 的 边 用 标号。 

引 理 4.29 oR <1, 那么 ，1, < 1,。 

RA, HEZE E TI4u] 的 情形 。 设 w' 是 u 的 子 节点 满足 v E Tw], WE w = <b. X 
BSB. Ou <u 《< 人， 我 们 推导 出 w 不 是 zx 的 父 节 点 ， 因 此 , lw, LASE, WL he 

其 次 ， 考 虑 1,> 的 情形 ， 在 这 种 情况 下 w 是 wu 的 父 节点 ， 可 参见 如 下 。 到 父 节 点 的 边 标 以 
kus ky < lo Bju P ARW EAER ku FRIERE Ww ERA < I。 因 为 w 是 4 的 父 节 
A, FÆ, h< ls<b。 口 

在 v 点 传输 的 范 函 数 定 义 如 下 。 两 个 节点 u 和 v 的 最 小 公共 祖先 (lowest common ancetor) 
是 树 中 的 最 小 节点 。 设 lica(n，v) 表示 u 和 v 的 最 小 公共 祖先 的 标号 。 定 义 


fu) =(-lca(u,v),L) 。 


引 理 4.30 teRl,<l,, BA, fw) <f(u). 

EA. BEB EY E TURRE, KASE, Iealu, v) = 1. mw ups, Bev 
E T[w' ]， 则 有 (由 前 述 引 理 ) << 有 大。 因此 w E T [w' ]， 这 蕴含 着 ica(w, v) >1 > L。 
于 是 , f.(w) <f,(u). 

其 次 ， 考 虑 1, > 的 情形 ， 由 前 述 引 理 ，w 是 4 的 父 节 点 ， 由 于 v Tiu], lca(w, v) = 
lca(u, v). BÆRE <L, AIE, f.(w) <f(w)。 口 

现在 可 以 证 明 ， 每 一 个 包 到 达 它 的 目的 节点 。 图 4-16 表 明了 流向 v 的 包 流 。 设 到 v* 的 包 在 节 
点 4 中 产生 。 由 引 理 4.28 可 得 ， 节 点 标号 每 次 跳跃 后 减 小 ， 经 过 有 限 次 跳跃 后 ， 该 包 被 节点 mw 
接收 到 ， 且 久 ,< 1,。 由 引 理 4.29，w 之 后 包 所 转发 到 的 每 个 节点 ， 其 标号 也 满足 < 1,。 由 引 理 
4.30， 节 点 每 次 跳跃 后 碱 小 ， 或 者 包 到 达 节 点 v， 因 此 经 过 有 限 次 跳跃 后 ， 节 点 v 接 到 该 包 。 
这 就 完成 了 定理 4.25 的 证 明 。 . 口 

1. 区 间 路 由 效率 : 一 般 情形 

定理 4.25 表 明 ， 每 个 网 络 存 在 有 效 的 ILS ， 但 这 并 不 蕴含 着 ， 这 种 模式 所 选择 的 路 径 是 有 
效 的 。 深度 优 先 搜索 ILS 用 来 表明 网 络 中 模式 的 存在 性 ,但 不 一 定 是 最 好 的 可 能 的 模式 。 例 如， 
如 果 深 度 优先 搜索 被 用 到 N 个 节点 的 环 上 ， 存 在 节点 uw 和 v 且 4d (u,v) = 2， 这 种 模式 使 用 N-2 
次 跳跃 将 包 从 4 传递 到 vy (习题 4.8 ) 。 由 定理 4.34 可 得 ， 对 于 同样 的 环 ， 存 在 ILS 通 过 最 小 跳跃 
路 径 传递 每 个 包 。 

为 了 分 析 路 由 方法 在 这 方面 的 质量 ， 首 先 做 出 以 下 定义 。 

定义 4.31 如 果 ILS 经 过 最 优 路 径 转 发 所 有 包 ， 则 它 是 最 优 的 。 
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如 果 ILS 在 一 次 跳跃 中 ， 将 包 从 一 个 节点 传递 到 该 节点 的 近邻 ， 则 称 ILS 是 近邻 的 。 

如 果 与 每 条 边 对 应 的 区 间 是 线性 的 ， 则 称 ILS 是 线性 的 。 

如 果 关 于 最 小 跳 数 (或 者 最 短路 径 ) 
代价 度量 是 最 优 的 ， 则 称 ILS 是 最 小 跳 数 
(或 最 短路 径 ) 的 。 易 证 明 ， 如 果 模 式 是 最 
小 跳 数 的 ， 那 么 它 是 近邻 的 。 容 易 验 证 ， 
ILS 是 线性 的 ， 当 且 仅 当 在 Lz 0 的 各 节点 z 
中 ， 存 在 标号 为 0 的 边 ， 且 在 标号 为 0 的 那 
个 节点 中 ,存在 标号 为 0 或 1 的 边 。 由 此 得 
出 ， 对 于 一 般 的 网 络 ， 路 由 方法 的 质量 是 
不 佳 的 ， 但 是 对 于 几 类 特殊 的 网 络 拓扑 结 图 4-16 深度 优先 搜索 ILS 中 的 包 路 由 (节点 v) 

构 ， 这 种 模式 的 质量 非常 好 。 这 使 得 该 方法 适合 于 具有 规则 结构 的 处 理 器 网 络 ， 例 如 ， 那 些 
用 于 实现 具有 全 局 共享 存储 器 的 并 行 计 算 机 。 

对 于 任意 网 络 ， 还 不 清楚 最 好 的 区 间 标 号 模式 与 一 个 最 优 路 由 算法 相 比 的 差距 。Ruzitka 
给 出 的 路 径 长 度 下 界 ， 蕴 含 着 最 优 的 ILS 并 不 总 是 存在 。 

定理 4.32[Ru288] 存在 网 络 G， 满 足 对 于 G 的 每 一 有 效 ILS， 存 在 节点 u 和 v， 满 足 至 少 3/2 
Do 次 跳跃 后 ， 将 包 从 4 传输 到 v。 

目前 还 不 清楚 网 络 最 好 的 深度 优先 搜索 ILS 与 同 网 络 的 最 优 ILS 比 较 的 结果 。 习 题 4.7 给 出 
了 一 个 较 差 的 网 络 深 度 优先 搜索 ILS 的 例子 ， 实 际 上 ，( 由 定理 4.37) 承认 了 它 是 最 优 的 ILS。 
但 对 同一 网 络 ， 也 可 能 存在 更 好 的 深度 优先 搜索 ILS。 

在 大 多 数 通信 和 是 在 近邻 之 间 进 行 的 情况 下 ， 成 为 近邻 是 ILS 的 充分 条 件 。 正 如 在 图 4.15 中 
所 见 到 的 那样 ， 深 度 优先 搜索 ILS 不 必 是 近邻 的 。 节 点 4 经 过 节点 1 转发 包 给 节点 2 GER). 

2. 多 路 区 间 路 由 模式 

如 果 人 允许 对 每 一 条 边 赋 予 一 个 以 上 的 标号 ， 可 以 改进 路 由 算法 的 效率 ， 就 是 我 们 所 说 的 
多 路 区 间 路 由 模式 。 这 将 边 的 目的 节点 集合 定义 为 几 个 区 闻 的 并 集 。 通 过 增加 区 间 的 数目 ， 
甚至 对 于 任意 网 络 ， 也 可 以 达到 最 优 路 径 。 为 了 表明 这 一 点 ， 首 先 考虑 最 优 路 由 表 ， 例 如 ， 
变更 算法 计算 的 最 优 路 由 表 ， 通 过 某 一 边 路 由 的 目的 节点 的 集合 可 以 表示 为 循环 区 间 的 并 集 。 
利用 这 种 方法 ， 每 一 边 可 以 找到 至 多 N/2 个 标号 ， 任 一 节点 至 多 共有 N 个 标号 ， 这 样 一 张 表 的 
存储 空间 ， 和 存储 整 张 路 由 表 的 存储 空间 相同 。 

可 能 以 存储 空间 复杂 度 为 代价 ， 提 高 路 由 的 效率 。 很 自然 地 引出 的 问题 是 ， 要 达到 最 优 
路 由 ， 网 络 实际 需要 多 少 标号 。Flammini 等 人 做 了 开创 性 的 工作 [FLMS95]， 他 们 研究 了 一 种 
寻找 模式 并 提供 较 低 界限 的 方法 ， 这 就 是 在 一 般 情况 下 ， 每 一 条 边 有 B(N) 个 标号 就 能 达到 
最 优 。 但 只 允许 在 路 径 长 度 上 进行 小 的 折衷 ， 就 可 以 大 大 减 小 路 由 表 的 大 小 ， 有 关 这 种 权衡 
的 详细 结果 参见 Riz 这 ka 所 做 的 汇总 [Ruz98]。 

3. 线性 区 间 路 由 模式 

在 区 间 路 由 方法 中 ， 考 虑 循环 区 间 是 重要 的 。 尽 管 对 某 些 网 络 的 确 有 效 ， 甚 至 是 最 优 ， 








线性 区 间 标 号 模式 不 可 能 用 线性 区 间 对 每 一 网 络 有 效 地 标号 。Bakker、Van Leeuwen 和 Tan 研 


究 了 线性 区 间 标 号 模式 的 可 应 用 性 [BLT91]。 
定理 4.33 存在 一 种 网 络 ， 不 存在 有 效 线性 区 间 标 号 模式 。 
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证 明 。 考 虑 长 度 为 2 的 三 条 腿 的 蜂 蛛 图 ， 如 图 4-17 的 描述 。 最 小 标号 0 和 最 大 标号 6 赋 给 两 
个 节点 。 因 为 有 三 条 腿 ， 所 以 至 少 有 一 条 腿 既 不 包含 最 小 标号 ， 也 不 包含 最 大 标号 。 设 x 是 这 
条 腿 上 远离 中 心 的 第 一 个 节点 。 节 点 x 将 地 址 为 0O 和 6 的 包 转 发 到 中 心 ， 包 含 0Oo 和 6 的 惟一 线性 区 
间 是 整个 集合 Zw。 因 此 ，x 同 时 也 将 包 转 发 到 朝向 中 心 的 它 的 其 他 近邻 ， 这 些 包 永远 到 不 了 目 
的 节点 。 口 









标号 0 和 6 被 赋 给 
虚 杠 中 的 节点 


图 4-17 三 条 腿 的 蜂 蛛 图 


Bakker, Van Leeuwen 和 Tan 全 面 地 刻画 了 承认 最 短路 径 线性 ILS 的 那 类 网 络 拓扑 结构 ， 提 
出 了 许多 与 承认 自 适应 性 和 最 小 跳 数 线性 ILS 的 拓扑 结构 相关 的 结果 。Fragniaud 和 
Gavoille{[FG94] 刻 画 了 允许 线性 模式 的 网 络 。Eilam 等 人 {EM296] 证 明了 在 这 些 网 络 中 使 用 线 
性 模式 所 得 到 的 路 径 长 度 可 与 OLD?) 一 样 大 。 

4. 区 间 路 由 的 最 优 性 : 特殊 拓扑 结构 

对 于 几 类 规则 结构 的 网 络 ， 存 在 最 优 区 间 标号 模式 。 这 些 结构 的 网 络 可 用 于 并 行 计算 机 
的 实现 。 

定理 4.34[LT87] 对 于 N 个 节点 的 环 网 ， 存 在 最 小 跳 数 ILS。 

证 明 。 对 节点 的 标号 按照 顺 时 针 方向 从 0 到 N-1 赋 值 。 对 于 节点 ;， 顺 时 针 信 道 被 赋 给 标号 
i +1， 逆 时 针 信道 被 冉 给 标号 (i + fNW/21 ) mod N; 参见 图 4-18。 用 这 种 标号 模式 ， 标 号 为 i 
的 节点 经 顺 时 针 信道 将 包 发 送 到 节点 ;+1，…，(i+ [N/21 ) -1 ， 经 逆 时 针 信道 将 包 发 送 到 节 
点 (i+ [N/2]), ..., 1-1, ROM. 口 
| 由 于 定理 4.34 的 证 明 ，ILS 是 最 优 的 ， 所 以 它 是 相 邻 的 和 非 线性 的 。 





图 4-18 环 网 的 最 优 ILS 
定理 4.35{LT87] 对 于 n xn 的 网 格 ， 存 在 最 小 跳 数 ILS。 
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证 明 。 以 行为 主 序 对 节点 的 标号 赋值 。 例如, 第 j 行 、 第 i 个 节点 的 标号 为 Uj-1)n+ (i-1). 
节点 的 上 信道 标 以 9 ， 左 信道 标 以 (j-1)n， 右 信道 标 以 《j-1)n+ i， 下 信道 标 以 jn。 参 见 
图 4-19。 

容易 验证 ， 当 节点 u 转 发 包 给 v 时 ， 

情形 1: 如 果 v 所 在 的 行 高 于 u 所 在 的 行 ， 那 么 经 过 上 信道 发 送 包 。 

情形 2: 如 果 v 所 在 的 行 低 于 u 所 在 的 行 ， 那 么 4 经 过 下 信道 发 送 包 。 

情形 3: 如 果 v 与 x 在 同一 行 ， 且 在 wu 的 左边 ， 那 么 u 经 过 左 信道 发 送 包 。 

情形 4: 如 果 v 与 4 在 同一 行 ， 且 在 u 的 右边 ， 那 么 u 经 过 右 信 道 发 送 包 。 

在 任何 情况 下 ，V 发 送 包 到 一 个 比 * 近 的 节点 ， 这 和 区 含 着 所 选 路 径 是 最 优 的 。 口 

因为 定理 4.35 所 证 明 的 ILS 是 最 优 的 ， 所 以 它 是 相 邻 的 ;标号 模式 也 是 线性 的 。 


列 1 列 ? an 





节点 (j-1) n+ 
(i-1) 的 信道 标号 


图 4-19 ”xm 网 格 的 最 优 ILS 


我 们 仅 给 出 了 以 下 两 个 结果 ， 没 有 证 明 。 定 理 中 声称 的 标号 模式 的 构造 过 程 作 为 练习 留 
给 读者 。 

定理 4.36 ”对 于 超 立 方 体 网 络 ， 存 在 最 小 跳 数 线性 ILS。 

定理 4.37[FJ88] 对 于 具有 任 圳 信道 权 值 的 外 平面 网 络 ， 存 在 最 短路 径 ILS。 

与 分 别 存储 每 个 目的 节点 输出 信道 的 经 典 路 由 方法 相 比 ， 区 间 路 由 有 许多 吸引 人 的 优 


(1) 低空 间 复 杂 度 ”对 于 度 为 4eg 的 节点 ， 存 储 路 由 表 的 空间 复杂 度 为 O( deg - logN) 


(2) 路 由 表 计 算 效率 高 ”利用 分 布 式 深 度 优先 搜索 遍历 网 络 ， 计 算出 深度 优先 搜索 ILS 的 
路 由 表 。 该 计算 利用 了 O(E) 条 消息 ， 时 间 复 杂 度 为 O(N)。 参 见 6.4 节 。 

(3) 最 优 性 ”对 于 几 类 特殊 的 网 络 ， 路 由 方法 可 以 选择 出 最 优 路 径 。 参 见 定理 4.34 到 
4.37. 

这 些 优 点 使 得 方法 适合 于 具有 规则 拓扑 结构 的 处 理 器 网 络 。 例 如 ，Transputers 常 常用 于 
构造 这 样 的 拓扑 结构 。Inmos C104 路 由 芯片 (参见 1.1.5 小 节 ) 被 设计 使 用 区 间 路 由 。 

令 人 遗憾 的 是 ， 对 于 任意 拓扑 结构 网 络 的 应 用 ， 当 使 用 深度 优先 搜索 ILS 时 ， 就 存在 许多 
缺点 。 
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(1) 健壮 性 不 好 ”信道 或 节点 的 加 入 网 络 或 从 网 络 中 去 除 ， 都 可 能 有 点 不 适应 深度 优先 
搜索 ILS 。 

ILS 所 基于 的 深度 优先 搜索 树 可 能 不 再 满足 只 在 节点 和 它 的 祖先 之 间 有 非 树 边 的 要 求 。 因 
此 ， 网 络 拓扑 结构 的 稍微 改变 就 要 求 对 路 由 表 进 行 完全 的 重新 计算 ， 包 括 对 每 一 节点 重新 赋 
给 地 址 (标号 )。 

(2) 非 最 优 性 ”深度 优先 搜索 ILS 在 进行 路 由 时 ， 经 过 的 路 径 长 度 为 8(N) 即使 在 网 络 直 
径 较 小 时 ， 参 见习 题 4.7。 

文献 中 讨论 了 许多 区 间 路 由 的 其 他 形式 。 以 前 讨论 过 的 多 路 区 间 路 由 是 一 种 相当 实用 的 
方法 ， 因 为 随 着 现代 存储 技术 的 进步 ， 拥 有 额外 标号 的 代价 将 不 再 是 问题 。Flammini 等 人 
[FGNT98] 描 述 了 多 维 变量 方法 。 多 维 空间 中 的 节点 名 和 标号 是 点 和 区 间 ， 而 不 是 Zr。 该 方法 
为 有 多 维 结构 ， 如 产品 图 的 网 络 带 来 了 好 处 。 

更 灵活 的 一 种 利用 网 络 结构 的 方法 是 由 Flammini 等 人 [FG s 93] 提 出 的 布尔 路 由 算法 
(boolean routing)。 其 中 节点 名 是 位 串 ， 节 点 的 标号 是 谓词 ， 当 且 仅 当 J (4) 成 立时 ， 目 的 节 
所 标 号 为 4 的 消息 能 够 被 通过 标号 为 L 的 链 路 发 送 。 该 方法 允许 有 效 地 使 用 相当 复杂 的 网 络 结 
构 ， 但 对 于 标号 的 说 明 却 相当 复杂 。 


44.3 前 缀 路 由 


为 克服 区 间 路 由 算法 的 缺点 ，Bakker，Van Leeuwen 和 TanfBLT93] 设 计 了 一 种 路 由 算法 ， 
利用 任意 生成 树 来 计算 路 由 表 。 非 限制 性 生成 树 的 使 用 既 可 以 提高 健壮 性 又 可 以 提高 效率 。 如 
果 在 两 个 现 有 节点 间 增 加 信道 ， 生 成 树 仍然 是 生成 树 ， 而 新 的 信道 是 非 树 边 。 如 果 增 加 新 的 节 
点 以 及 许多 将 它 与 现 有 节点 连接 的 信道 ， 使 用 其 中 的 一 个 信道 和 这 个 新 节点 就 可 以 扩展 这 棵 生 
成 树 ， 其 余 信 道 是 非 树 边 。 通 过 选择 最 小 深度 生成 树 ， 可 以 改进 最 优 性 ， 如 引 理 4.22 所 示 。 

前 缀 路 由 中 节点 和 信道 所 用 的 标号 是 串 ， 而 不 是 区 间 路 由 中 使 用 的 整数 。 设 8 是 字母 表 ， 
标号 则 是 定义 在 字母 表 2 上 的 串 ，E 表 示 空 串 ，2* 表 示 2 上 串 的 集合 。 为 了 选择 转发 一 个 包 所 
用 的 信道 ， 算 法 考虑 标号 为 目的 节点 地 址 前 缀 的 所 有 信道 。 选 择 最 长 的 标号 ， 以 及 相应 的 用 
于 转发 包 的 信道 。 例 如 ,假设 有 一 节点 ， 其 信道 标号 为 aabb、abba、aab、aabc 和 aa， 要 转 
发 地 址 为 aabbe 的 包 。 信 道 标号 为 aabb、aab ， 且 aa 是 aabbc 的 前 级 ， 这 三 种 标号 中 最 长 的 是 
aabb。 因 此 节点 经 过 信道 aabb 转 发 包 。 图 4-20 所 示 的 算法 给 出 了 转发 算法 。 我 们 用 a < 8 表示 
ake BHD Ai RR. 






(* A packet with address d was received or generated at node u *) 
if d= 
then deliver the packet locally 
else begin a; := the longest channel-label s.t. a; dd ; 
send packet via the channel labeled with a; 







end 





图 4-20 前 组 转发 算法 (节点 4) 


定义 4.38 定义 网 络 G 的 前 组 标号 模式 (了 3 上) 为 
(1) 用 2* 中 不 同 字符 串 给 G 中 节点 赋值 ; 且 
(2) 对 于 每 一 节点 ， 用 不 同 字符 串 给 该 节点 的 信道 赋值 。 
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前 绥 路 由 算法 假设 给 定 前 绥 标 号 模式 (PLS ) ， 用 图 4-20 所 示 的 算法 的 转发 包 。 

定义 4.39 如 果 所 有 包 按 照 这 种 方法 最 终 转 发 到 达 目 的 节点 ， 则 称 前 缓 标号 模式 是 有 效 的 。 

定理 4.40 ”对 于 每 一 个 连通 网 络 @， 存 在 有 效 的 PLS 。 

证 明 。 定 义 一 类 前 组 标号 模式 ， 并 且 在 定理 4.25 中 证 明 ， 这 类 模式 是 有 效 的 。 设 7 表示 G 
的 任意 一 棵 有 根 生成 树 。 

定义 4.41 G 的 树 PLS (关于 树 T) 是 一 种 前 级 标号 模式 ， 满 足以 下 规则 。 

(1) ARF ROS RE, 

(2) ewu ps, MA, A-DFRLITUPAL, P, eR, .., wT HUH 
FPA, MA, yaha, KPA, GRIP OKABE, 

(3) 如 果 uw 是 非 树 边 ， 那 么 ，Qw = luvo 

(4) toRwkuhF GA, BA, Qu = 人。 

(5) wRweuhxL FH, HA, a=, Pakuh SARE, AHH, Qw = lwo 

在 树 PLS 中 ， 除 根 节点 之 外 ， 每 一 节点 都 有 标 以 E 的 信道 ， 这 个 信道 连接 该 节点 与 它 的 祖 
先 〈 节 点 的 父 节 点 或 树 的 根 )。 对 于 每 一 信道 ww， 或 者 aw =), RH, = E。 对 于 所 有 u 和 lv， 
"是 zx 的 祖先 ， 当 且 仅 当 上 41,。 

首先 必须 证 明 ， 包 不 会 “ 卡 ” 在 一 个 与 其 目的 节点 不 同 的 节点 处 ， 即 ， 与 目的 节点 不 同 
的 每 个 节点 都 可 利用 图 4-20 所 示 的 算法 的 转发 包 。 

引 理 4.42 对 于 所 有 满足 条 件 u 关 vb 的 节点 u 和 v，u 中 存在 信道 ， 以 的 前 组 标号 。 

证 明 。 如 果 4 不 是 7 的 根 ， 那 么 有 标 以 E 的 信道 ， 它 是 1, 的 前 综 。 如 果 u 是 7 的 根 ， 那 么 v 不 
是 7 的 根 ， 且 v € TTu] 成 立 。 如 果 w 是 u 的 子 节点 ， 满 足 v E Tw], WARE, Qw aly. 口 

利用 图 4-20 所 示 的 算法 ， 以 下 三 个 引 理 考 虑 节点 u 为 节点 v 向 节点 w(x 的 近邻 ) 转发 包 的 
情况 。 

引 理 4.43 如果 wu ET7fv]， 那 么 ，m 是 & 的 祖先 ， 

证 明 。 如 果 Qw = E， 那 么 如 前 所 述 ，w 是 zx 的 祖先 。 如 果 aw = 1,， 那 么 因为 a 41H, 4 
人 。 这 缆 含 着 w 是 "的 祖先 ， 也 是 zx 的 祖先 。 口 


引 理 4.44 如 果 14 是 v 的 祖先 ， 那 么 ，w 是 v 的 祖先 ， 比 xz 更 靠近 ，。 
证 明 。 设 w' 是 4 的 子 节点 ， 满足 " E€ T[w' ] ， W auw = Ly fel, BUSES BTR. AF a, Fel RR 
长 前 缀 (在 zx 中 ) ， 由 此 可 得 cw 0 44,， 因 此 w 是 在 wu 下面 v 的 祖先 。 口 


引 理 4.45 如果 u 锋 TIv]， 那 么 ，w 是 v 的 祖先 ， 或 者 di (w, v) <dr(u, v). 

证 明 。 如 果 aw = E， 那 么 w 是 zx 的 父 节点 或 者 根 ; Au 从 TI]， 所 以 zx 的 父 他 点 比 x 更 靠近 v， 
根 是 "的 祖先 。 如 果 auw = 六， 那么 ， 因 为 as， 所 以 mw 是 v 的 祖先 。 口 

设 树 7 的 深度 为 4epthy， 即 从 根 到 任 一 叶 节 点 最 长 简单 路 径 的 跳 数 。 可 见 ， 目 的 节点 为 y 的 
包 到 达 其 目的 节点 最 多 的 跳 数 为 2 . depth。 如 果 包 是 v 的 祖先 产生 的 ， 那 么 由 引 理 4.44， 在 
depth 跳 数 内 就 可 达到 v。 如 果 包 是 在 子 树 T [v] 内 产生 的 ， 那 么 由 引 理 4.43， 在 depih 跳 数 内 就 
可 达到 v 的 祖先 ， 青 经 过 另 一 个 depth 跳 数 达 到 v。( 因为 在 这 种 情况 下 ， 路 径 只 包含 源 节 点 的 祖 
先 ， 它 的 长 度 实际 上 也 受到 depth 的 限制 .) 由 引 理 4.45， 在 所 有 其 他 情况 下 ， 在 depth 之 内 就 
可 达到 vy 的 祖先 ， 之 后 ， 在 另 一 depth 跳 数 之 内 就 可 达到 v。( 在 这 种 情况 下 ， 路 径 长 度 受 到 
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2- depth 的 限制 .) 这 就 完成 了 定理 4.40 的 证 明 。 

推论 4.46 对 于 直径 为 D6 的 每 个 网 络 G (以 跳 数 作为 度量 标准 )， 存 在 前 组 标号 模式 ， 至 
多 在 2Dc 个 跳 数 内 传递 所 有 包 。 

证 明 。 利 用 引 理 4.22 所 选择 的 树 构造 PLS 即 得 。 口 

最 后 简明 分 析 树 标号 模式 所 需 空间 来 结束 本 节 。 如 前 所 述 、 设 depth 表 示 T 的 深度 ，k 是 树 
7 中 任 一 节点 子 节点 的 最 大 数 。 最 长 的 标号 由 depth 个 字符 组 成 ， 因 为 > 至 少 包 含 k 个 字符 ， 一 
个 标号 存储 所 需 空间 为 depth: logk 位 。 有 deg 条 信道 的 节点 的 路 由 表 的 存储 空间 为 O( deg - 
depth - logk) 位 。 

Bakker 等 人 在 文献 [BLT93] 中 提出 了 其 他 一 些 前 缀 标号 模式 。 他 们 的 论文 刻画 了 这 类 网 络 
的 拓扑 结构 ， 该 拓扑 结构 使 链 路 权 值 动态 改变 时 ， 也 有 最 优 的 前 缀 标号 模式 。 


4.5 分 级 路 由 


一 种 减少 路 由 中 各 种 代价 参量 的 方法 是 对 网 络 进行 分 级 划分 以 及 使 用 相关 分 级 路 由 方法 。 
在 多 数 情况 下 ， 目 标 是 尽 可 能 地 利用 这 样 一 个 事实 ， 即 ， 计 算 机 网 络 中 的 很 多 通信 都 是 局 部 
的 ， 如 在 距离 相对 小 的 节点 间 进行 通信 。 路 由 方法 的 一 些 代 价 参数 取决 于 整个 网 络 的 大 小 ， 
而 不 是 所 选 路 径 的 长 度 ， 正 如 现在 我 们 所 解释 的 。 

(1) 地 址 长 度 ”因为 N 个 节点 中 ， 每 个 都 有 不 同 的 地 址 ， 每 个 地 址 至 少 由 logN 位 组 成 。 如 
果 信 息 按照 地 址 进行 编码 ， 就 需要 更 多 位 存储 空间 ， 如 ， 前 组 路 由 。 

(2) 路 由 表 大 小 在 4.2 节 和 4.3 节 中 所 描述 的 路 由 方法 中 ， 路 由 表 中 包含 每 一 节点 的 条 目 ， 
且 路 由 表 的 大 小 是 线性 的 。 

(3) 查找 路 由 表 的 代价 ”对 于 大 型 路 由 表 或 者 更 大 地 址 ， 单 个 路 由 表 查 找 的 代价 可 能 较 
大 。 传 输 一 条 消息 的 查找 总 时 间 还 取决 于 访问 路 由 表 的 次 数 。 

在 分 级 路 由 方法 中 ， 网 络 被 划分 成 医 ， 每 一 簇 是 节点 的 连通 子 集 。 如 果 包 的 源 节点 和 目 
的 节点 在 同一 笨 中 ， 则 转发 消息 的 代价 较 低 ， 因 为 在 铸 内 路 由 时 ， 把 一 徐 看 作 相对 较 小 独立 
的 网 络 。 对 于 4.5.1 节 中 所 描述 的 方法 ， 每 一 徐 中 有 一 个 固定 的 节点 GENO Ps), ， 如 果 需 要 将 
包 发 送 到 其 他 焦 ， 它 进行 更 复杂 的 路 由 决策 。 只 在 中 心 需要 较 长 路 由 表 和 长 地 址 的 操作 。 每 
一 矮 又 可 分 成 若干 子 徐 ， 以 便 获得 节点 的 多 级 划分 。 

簇 之 间 的 每 次 通信 不 一 定 必须 道 过 簇 中 心 。 这 种 设计 类 型 也 有 缺点 ， 如 果 铸 中 心 发 生 故 
障 ， 会 影响 整个 给 。Lenfert 等 人 [LUST89] 描 述 了 一 种 分 级 路 由 方法 ， 其 中 每 个 节点 都 可 以 同 
等 地 向 外 乌 发 送 消息 。 然 而 这 种 方法 只 利用 了 小 规模 的 路 由 表 ， 因 为 将 整个 禾 (该 儿 中 有 不 
属于 它 的 节点 ) 看 作 了 一 个 节点 。Awerbuch 等 人 [ABNL90] 利 用 分 级 路 由 的 范 型 构造 了 一 类 路 
由 模式 ,允许 在 效率 和 空间 复杂 度 之 间 进行 权衡 。 


减少 路 由 决策 数 到 目前 为 止 所 讨论 的 路 由 方法 ， 要 求 在 每 一 中 间 节 点 上 做 出 路 由 决策 。 这 意 
味 着 对 于 长 为 的 路 由 ， 要 访问 路 由 表 ! 次 。 对 于 最 小 跳 数 路 由 策略 ，! 由 网 络 直径 限定 。 但 是 
对 于 一 般 无 回路 的 路 由 策略 (如 区 间 路 由 )，N-1 是 给 出 的 最 好 鼻 限 。 在 本 小 节 ， 我 们 讨论 一 
种 方法 通过 它 ， 可 以 降低 查找 路 由 表 的 数目 。 

利用 以 下 引 理 ， 讨 论 将 网 络 划分 成 连通 子 答 的 可 能 性 。 


引 理 4.47 对 于 每 个 ;< N， 存 在 将 网 络 分 成 族 Cl，.…， Cn 的 划分 方法 ， 满 足 











PIF H y 9 


(1) ARR- ETR, 

(2) ARES BAs A, £ 

(3) EARP E S A2s, 

证 明 。 设 D1!，…，D， 是 不 相交 连通 子 图 的 最 大 和 集合， 满足 每 一 D; 的 半径 <s， 至 少 包 含 s 
个 节点 。 不 在 集合 U”, 中 的 每 一 节点 ， 通 过 长 度 至 多 为 的 路 径 与 这 些 子 集 之 一 相连 ， 否 则 增 
DER EVE ATE 通过 将 不 在 集合 U7 中 的 每 一 节点 包含 进 与 它 最 接近 的 簇 , 可 以 形成 簇 Ci。 
扩展 的 徐 每 个 仍然 包括 至 少 s 个 节点 ， 它 们 仍然 是 连通 和 不 相交 的 。 且 半径 至 多 为 2s。 c 

假设 只 有 几 种 颜色 可 用 ， 路 由 方法 为 每 一 个 包 赋 予 一 种 颜色 。 节 点 作用 如 下 。 依 靠 它 的 
颜色 ， 包 或 者 立即 通过 固定 信道 转发 (对 应 于 颜色 )， 或 者 调用 更 复杂 的 路 由 决策 方法 。 它 允 
许 节 点 运用 不 同 的 协议 处 理 包 。 

定理 4.48[LT86] 对 于 N 个 节点 的 网 络 ， 存 在 路 由 方法 ， 对 于 每 个 包 至 多 要 求 O( INNA 
由 决策 和 使 用 三 种 颜色 。 

证 明 。 假 设 给 定 引 理 4.47 所 蕴含 的 划分 。 由 于 Ci, 的 半径 至 多 为 2s ， 对 于 每 一 v E Cj， 每 个 
Ci 包含 满足 条 件 4(v，ci) 《2s 的 节点 c;。 设 7 是 G 的 连接 所 有 ci 的 最 小 规模 子 树 。 因 为 T 最 小 ， 它 
包含 至 多 m 个 叶 节 点 ， 因 此 它 包含 至 多 m2 个 分 支 节 点 ( 度 大 于 2 的 节点 ) ; 参见 习题 4.9。 我 
们 称 7 中 的 节点 为 中 心 节点 (ci)、 分 支 节点 和 路 径 节 点 (其余 节点 )。 

路 由 方法 首先 将 包 发 至 源 节点 所 在 艇 的 中 心 节点 c;( 绿 阶段 ) 处 ， 然 后 经 过 7 到 目的 节点 
RAL i ic) 〈 蓝 阶段 )， 最 后 在 C; 内 到 达 目 的 节点 ( 红 阶 段 )。 对 于 每 钴 的 中 心 节 点 ， 绿 阶 
段 使 用 固定 汇集 树 ， 不 需 路 由 决策 。7 的 路 径 节点 有 两 条 依附 树 的 信道 ， 最 终 经 过 不 接收 包 的 
树 的 信道 将 每 一 蓝 包 转 发 出 去 。 分 支 节 点 和 树 7 的 中 心 节点 必须 经 过 路 由 决策 。 对 于 红 阶 段 ， 
在 和 仁 内 利用 最 短路 径路 由 方法 ， 将 该 阶段 路 由 决策 数 限制 到 2*。 这 使 得 路 由 决策 数 的 界限 为 
2m-2 +25， 至 多 为 2Ws-2+25， 选 择 *= JN ， 则 得 O( YN ) 的 界限 。 

定理 4.48 建 立 了 传输 每 个 包 所 需 的 路 由 决策 总 数 。 但 是 在 做 决策 时 ， 这 一 结果 不 依赖 于 任 
何 特定 的 算 靶 。7 中 所 用 的 路 由 方法 可 以 是 Santoro 和 Khatib 的 树 路 由 模式 。 也 可 以 将 聚 类 原理 
进一步 应 用 于 7 来 减少 路 由 决策 数 。 

定理 4.49[LT86] 对 于 N 个 节点 的 网 络 和 每 个 正 整 数 F< logN， 存 在 路 由 方法 ， 对 于 每 个 包 
至 多 要 求 O(F. NY) 次 路 由 决策 和 21+1 种 颜色 。 

证 明 。 论 证 过 程 类 似 于 定理 4.48 的 证 明 。 不 是 选择 * ~ YN ， 而 是 反复 地 将 构造 过 程 用 于 
树 7〈 具 有 相同 的 秘 大 小 s)， 树 是 一 个 具有 少 于 2m 个 节点 的 连通 网 络 。 由 于 7 的 路 径 节点 只 将 
包 从 一 个 固定 信道 传输 到 另 一 个 信道 ， 因 此 可 以 名 栈 路 径 节点 。 

分 复 重 复 /次 。 网 络 G 有 N 个 节点 。 一 级 分 钱 后 所 得 的 树 至 多 有 NM/s 个 中 心 节点 和 N/s 个 分 支 
节点 ， 即 ，N(2/s) 个 关键 节点 。 如 果 ; 级 分 能 后 所 得 树 有 mm 个 关键 节点 ， BAH ROB 
得 树 至 多 有 mws 个 中心 节点 和 mi/s 个 分 支 节 点 ， 即 ，m;(2/s) 个 关键 节点 。 ,级 分 化 后 所 得 树 至 
多 有 mr = N(2/s) 个 关键 节点 。 

每 一 级 的 分 簇 增 加 两 种 颜色 ， 因 此 ，/ 级 分 和 焦 要 用 2f+1 种 颜色 。 在 最 高 级 ， 至 多 需 2m/ 次 决 
策 ， 在 目的 节点 灸 中 ， 每 一 级 分 簇 需要 * 次 决策 。 这 使 得 路 由 决策 数 为 2mr + fs. BERS = 2 NY, 
则 得 mr= O(1)。 因 此 路 由 决策 数 /F. s = Of. NY), 口 

大 约 用 log N 种 颜色 所 导致 的 路 由 方法 需 做 O(log N) 次 路 由 决策 。 在 这 种 情况 下 ， 对 包 颜 
色 的 检查 也 变 成 一 种 路 由 决策 。 但 仅 涉及 规模 较 小 的 表 ( 表 长 至 多 为 O(log N)). 实际 上 只 需 
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要 一 小 部 分 节点 。 
习题 


4.1 节 


4.1 假设 每 次 拓扑 结构 变化 后 ， 要 用 这 样 一 种 方式 更 新 路 由 表 ， 即 ， 即 使 是 在 更 新 表 的 
过 程 中 ， 也 是 无 回路 的 。 当 网 络 拓扑 结构 发 生 无 限 次 变化 时 ， 这 种 方法 能 保证 包 总 是 被 传输 
吗 ? 

证 明 在 拓扑 结构 不 断 变化 的 情况 下 ， 不 存在 路 由 算法 能 保证 包 被 传输 。 

4.2 节 

4.2 有 一 名 学 生 提 出 略 去 图 4-6 所 示 的 算法 中 的 <nys，m> 消 息 的 发 送 ; 他 认为 如 果 一 个 
节点 没有 接 到 近邻 的 消息 <ys，w>， 那么 节点 知道 这 个 近邻 不 是 了 中 的 子 节点 。 

是 否 可 以 按照 这 种 方法 修改 算法 呢 ? 此 时 算法 的 复杂 度 有 何 变化 ? 

4.3 证 明 以 下 断言 是 Chandy-Misra 算 法 计算 到 yo 的 路 径 (图 4-7 所 示 的 算法 ) BRER, 

Vu, w: <mydist, vo, d> E Mw, = dw, vo)< d 
A Vu: d(u, vo) < Divo] 
给 出 一 个 执行 的 例子 ， 其 中 消息 数 与 网 络 信道 数 成 指数 关系 。 
4.3 节 
4.4 如 下 图 所 示 ， 变 更 算法 用 于 下 列 拓扑 结构 的 网 络 ， 给 出 算法 的 终止 配置 中 所 有 变量 的 值 ， 


在 达到 终止 配置 之 后 ， 在 4 和 下 之 间 加 入 一 条 信道 。 当 处 理 通知 <repair，4> 时 ， 严 向 4 发 
153| 送 什么 消息 ? 一 旦 接 到 天 的 这 些 消 息 ，A 发 送 什么 消息 ? 


4.4 节 


4.5 对 于 具有 非 对 称 信道 代价 的 网 络 ， 给 出 一 个 引 理 4.22 不 成 立 的 例子 ， 并 加 以 说 明 。 

4.6 存在 不 需 使 用 所 有 信道 进行 路 由 的 ILS 吗 ?存在 有 效 的 吗 ? 存在 最 优 的 吗 ? 

4.7 ”给 出 一 个 图 G 和 G 的 深度 优先 搜索 树 T， 满 足 G 有 N = PABA, G 的 直径 和 树 T 的 深 
度 为 O(n)， 且 存在 节点 uw 和 v， 满 足 在 深度 优先 搜索 ILS 上 的 N-1 次 跳跃 后 ， 包 从 uu 被 传递 到 Vy。 

(可 以 用 这 种 方法 ， 选 择 图 ， 即 G 是 外 平面 图 ，( 由 定理 4.37) RERGERAAREILS,) 

4.8 给 出 N 个 节点 环 网 的 深度 优先 搜索 ILS。 找 出 节点 wu 和 v， 满 足 d(4，v) =2, 且 模 式 利 
用 N-2 次 跳跃 将 包 从 节点 u 传 输 到 节点 v。 


4.5 节 


4.9 证 明 :; 在 定理 4.48 的 证 明 中 ， 树 7 的 最 小 性 获 含 着 它 至 多 有 闵 个 叶子 。 证 明 具 有 mm 个 
叶子 的 树 至 多 有 m2 个 分 支 节点 。 





第 5 章 无 死 锁 的 包 交 换 


通过 包 交 换 通 信 网 络 进行 遍历 的 消息 ( 包 )， 在 被 转发 至 目的 路 径 的 下 一 节点 时 ， 必 须 存储 
在 每 一 节点 中 。 为 此 ， 网 络 中 的 节点 预 留 一 些 缓冲 区 。 由 于 每 个 节点 上 的 缓冲 区 数量 有 限 ， 
当下 一 节点 的 所 有 缓冲 区 已 满 ， 就 会 造成 包 不 能 够 转发 的 情况 ， 如 图 5$-1 中 所 示 。 四 个 节点 都 
有 8 个 缓冲 区 ， 每 一 缓冲 区 只 能 容纳 一 个 包 。 节 点 ?已 将 目的 节点 为 "的 B 个 包 发 送 至 节点 !， 节 
点 v 已 将 目的 节点 为 s 的 8 个 包 发 送 至 节点 4。 现 在 u 和 v 的 所 有 缓冲 区 已 满 ， 导 致 存储 在 uw 和 v 中 
的 包 都 不 能 被 转发 至 其 目的 节点 。 

当 一 组 包 正 在 相互 等 待 当 前 被 组 中 的 另 一 个 包 占 据 的 缓冲 区 时 ， 就 会 出 现 这 组 包 永 远 不 
能 到 达 目 的 节点 的 情况 ,我们 称 这 种 情况 为 存储 -转发 死 锁 (store-and-forward deadlock). 
(其 他 类 型 的 死 锁 将 在 本 章 最 后 讨论 ,) 在 设计 包 交 换 网 络 过 程 中 ， 重 要 问题 是 如 何 处 理 存 
储 -转发 死 锁 。 本 章 论 述 几 种 称 为 控制 器 (controller) 的 方法 ， 通 过 对 包 的 产生 或 者 转发 进行 
限制 来 避免 存储 -转发 死 锁 。 在 OSI 参考 模型 的 网 络 层 可 以 找到 避免 存储 -转发 死 锁 的 方法 
(1.2.2 小 节 )。 





图 5-1 存储 -转发 死 锁 示例 


基于 有 结构 的 和 无 结构 的 缓冲 池 ， 本 章 主 要 讨论 了 两 种 方法 。 如 果 一 个 节点 产生 或 接收 
数据 包 ， 利 用 有 结构 的 缓冲 地 (5.2 节 ) 的 方法 为 节点 获取 一 个 专门 缓冲 区 。 如 果 该 缓冲 区 被 占 
据 ， 就 不 能 接收 包 。 在 无 结构 的 缓冲 池 (5.3 节 ) 方 法 中 ， 所 有 缓冲 区 是 平等 的 ， 方 法 仅 指出 是 
否 能 够 接收 包 ， 并 不 决定 要 将 包 放 在 哪 一 个 缓冲 区 中 。5.1 节 引入 了 一 些 表 示 法 和 定义 ，5.4 节 
对 问题 做 了 进一步 的 讨论 ， 做 为 本 章 结束 。 


5.1 引言 


通常 ， 用 图 C = (Y， 司 模拟 网 络 ， 用 跳 数 度量 节点 间 的 距离 。 每 一 节点 有 B 个 缓冲 区 用 来 
临时 存放 包 。 已 表示 所 有 缓冲 区 的 集合 ， 符 号 bp、c、 妨 等 用 于 表示 缓冲 区 。 

可 用 以 下 三 种 类 型 的 迁移 描述 节点 对 包 的 处 理 。 

(1) 产生 ”节点 ua“ 创建 ”新 包 p (实际 上 是 接收 更 高 一 层 协 议 的 包 )， 并 把 它 放 入 4 的 空 
缓冲 区 中 。 节 点 u 称 为 p 的 源 。 

(2) 转发 ” 包 p 从 节点 u 被 转发 到 路 由 的 下 一 节点 w 的 空 缓冲 区 中 (路 由 由 所 用 的 路 由 算法 
类 定 )。 迁 移 的 结果 是 ，p 以 前 所 占据 的 缓冲 区 变 空 。 尽 管 我 们 将 要 定义 的 控制 器 可 能 不 人 允许 
迁移 ， 但 是 假设 网 络 总 是 允许 这 种 迁移 ， 即 ， 如 果 控 制 器 允许 迁移 ， 则 它 是 可 应 用 的 。 








在 具有 同步 消息 传递 的 系统 中 ， 很 容易 将 这 种 迁移 看 作 是 定义 2.7 中 的 一 次 转移 。 在 具有 
异步 消息 传递 的 系统 中 ， 这 种 迁移 并 不 是 像 定 义 2.6 中 的 一 次 转移 ， 但 是 可 以 实现 它 。 例 如 ， 
节点 4 不断 地 将 p 传 输 到 w， 只 要 没有 接 到 确认 ， 缓冲 区 就 不 丢弃 该 包 。 当 节点 w 接 收 包 时 ， 它 
决定 是 否 接 收 该 数据 包 ， 并 将 它 放 入 其 中 一 个 缓 促 区 。 如 果 接 收 ， 将 它 放 入 缓冲 区 中 ， 并 和 问 u 
发 送 确认 消息 ， 否 则 ， 简 单 地 忽略 该 数据 包 。 当 然 ， 可 以 设计 更 有 效 的 协议 实现 迁移 ， 例 如 ， 
如 果 u 知 道 w 会 接收 p，u 才 将 p 传 输 给 w。 在 这 种 情况 下 ， 迁 移 是 由 定义 2.6 中 论 及 的 几 种 转移 组 
成 的 本 章 将 把 它们 看 作 步 又 之 一 。 

(3) 消耗 占据 目的 节点 缓冲 区 的 包 p 被 从 缓冲 区 删除 。 假 设 网 络 总 是 允许 这 种 迁移 。 

用 刀 表 示 数 据 包 所 通过 的 所 有 路 径 集合 。 这 个 集合 由 路 由 算法 决定 (参见 第 4 章 )。 这 里 
并 不 关注 如 何 决 定 该 集合 。 设 k 是 马 中 最 长 路 径 的 跳 数 。 并 假设 k 不 等 于 G 的 直径 。 如 果 路 由 
算法 没有 选择 最 小 跳 数 路 径 ，k 就 可 能 超过 网 络 直 径 。 如 果 G 中 所 有 节点 的 通信 和 是 在 有 限 距离 
的 节点 间 ， 那 么 k 可 能 小 于 该 直径 。 

从 本 章 开 始 所 给 出 的 例子 来 看 ， 如 果 所 有 迁移 不 加 限制 的 进行 ， 就 有 可 能 出 现 死 锁 (如 ， 
阻止 执行 以 下 限制 : 如 果 x 中 产生 包 ，x 中 必须 有 空 缓冲 区 ; 如 果 将 包 转 发 到 节点 w，w 中 必须 
有 空 缓 冲 区 )。 我 们 定义 控制 器 为 这 样 一 个 算法 : 它 人 允许 或 者 禁止 网 络 中 的 各 种 迁移 ， 并 要 满 
足以 下 要 求 。 

(1) 总 是 允许 包 的 消耗 (在 目的 节点 )。 

(2) 在 所 有 缓冲 区 为 空 节点 上 ， 人 允许 产生 包 。 

(3) 控制 器 只 利用 局 部 信息 ， 即 ,是否 在 节点 x 能 接收 一 个 包 ， 只 取决 于 x 所 获得 的 信息 
和 包 中 的 信息 。 

第 二 种 情况 排除 了 一 些 琐碎 的 方法 ， 通 过 拒 收 网 络 中 的 任何 包 来 避免 死 锁 包 (参见 定义 
5.2)。 如 第 2 章 所 示 ， 乙 表示 节点 “的 状态 集 ，At 表示 可 能 的 消息 ( 包 ) 集 。 

定义 5.1 ”网 络 G = (V, E) 的 控制 器 是 序 偶 con = {Gen,, For ev) BA, FL Gen, G 
Z, x AM 和 For, SZ, x M, #Re,E ZAuHh-ARA, LuMMARH LHS, MA FH 
有 PE M, (ci, p) © Gen,. ' 

控制 器 con 允 许 在 节点 x 中 产生 包 p， 其 中 4 的 状态 为 c,， 当 且 仅 当 (cy, p) E Gen, RF 
从 uw 向 w 转 发 包 ， 当 且 仅 当 (c, p) E For。。 控 制 器 的 形式 定义 不 包括 包 消 耗 的 条 件 ， 因 为 
(在 目的 节点 ) 总 是 允许 包 消 耗 。 在 控制 器 con 之 下 的 网 络 迁移 就 是 con 所 允许 的 网 络 迁 移 。 

如 果 在 网 络 的 任何 迁移 序列 中 ， 都 不 能 到 达 目 的 节点 ， 称 网 络 中 的 包 是 死 锁 的 。 

定义 5.2 给 定 网 络 G 、G 的 控制 器 con 和 G 的 配置 [/， 如 果 不 存在 con 中 的 迁移 序列 ， 在 y 中 
是 可 应 用 的 ， 且 P 被 消耗 ， 称 包 P( 出 现在 配置 7 中) 是 死 镇 的 。 如 果 一 个 配置 包含 死 锁 包 ， 称 配 
置 是 死 锁 配置 。 

图 $-! 的 例子 表明 ， 每 个 控制 器 都 存在 死 锁 配置 。 控 制 器 的 作用 是 避免 网 络 进入 死 锁 配置 。 
网 络 的 初始 配置 为 空 ， 即 配置 中 不 存在 包 。 

定义 5.3 ”如 果 从 初始 配置 开始 ， 在 控制 器 作用 下 ， 不 会 达到 死 锁 配 置 ， 则 称 控制 器 是 无 
死 锁 的 。 


5.2 有 结构 的 方法 
我 们 将 要 讨论 所 谓 的 依赖 缓冲 图 的 一 类 控制 器 ， 这 类 控制 器 是 由 Merlin 和 Schweitzer 
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[MS80a] 提 出 的 。 这 些 缓冲 图 的 原理 是 基于 这 样 一 种 观察 ， 死 锁 是 由 于 出 现 循环 等 待 的 情况 
(在 无 控制 器 情况 下 )。 在 循环 等 待 的 情况 下 ， 存 在 包 的 序列 p。，.….，p,-!， 满 足 对 于 每 一 个 i 
Pi 想 要 迁移 到 被 pi (下 标 计 算 为 模 s) 所 占据 的 缓冲 区 中 。 可 以 沿 着 非 循环 图 缓冲 图 ) 中 的 
路 径 迁 移 包 ， 来 避免 死 锁 发 生 。 在 5.2.1 小 节 中 ， 定 义 了 缓冲 图 和 有 关 的 控制 器 。 给 出 了 两 个 
简单 的 缓冲 图 的 例子 。 在 5.2.2 小 节 中 ， 给 出 了 更 复杂 的 缓冲 图 构造 过 程 ， 同 时 给 出 了 两 个 例 
子 。 


5.2.1 缓冲 图 


给 定 带 有 缓冲 区 集合 如 的 网 络 C。 

定义 5.4 BYR (TG, B) 是 定义 在 网 络 缓冲 区 上 的 有 向 图 BG， 即 ，BGCG = (B, 
BE), BX 

(1) BG 是 无 环 的 (不 包含 有 向 回路 )。 

(2) bc EBE， 蔓 含 b 和 c 在 同一 节点 的 缓冲 区 中 ， 或 者 在 G 中 信道 连接 两 节点 的 线 冲 区 中 ， 
且 

(3) 对 于 每 一 路 径 PE PP ，BG 中 存在 路 径 ， 它 的 映像 是 已 

由 第 二 个 要 求 可 得 ， 存 在 从 BG 中 路 径 到 G 中 路 径 的 上 映射。 如果 b。，b1，...，b, 是 8G 中 的 一 
条 路 径 ， 那 么 ， 如 果 & 是 缓冲 区 5 所 在 的 节点 ， 则 wm， 司 ，…，4& 是 节点 序列 ， 满 足 对 于 每 个 ! < 
S, Ruun E EREU = usi。 那 么 ， 由 此 序列 去 掉 重 复 之 后 所 得 G 中 的 路 径 称 为 BG 中 原始 路 
bo, by, .., DAR. 

包 不 能 放 人 任意 选择 的 缓冲 区 中 ; 必须 放 在 经 过 BG 中 的 路 径 能 够 到 达 的 目的 节点 的 缓冲 
区 中 。 即 ， 按 照 如 下 定义 ， 帮 在 合适 于 包 的 缓冲 区 中 。 

定义 5.5 ” 设 p 是 目的 节点 为 ?的 节点 zt 中 的 包 。 如 果 在 BG 中 存在 从 5 到 中 线 冲 区 c 的 路 径 ， 
则 称 x 中 的 缓冲 区 0 适合 于 p。 它 的 像 是 G 中 p 通 过 的 一 条 路 径 。 

BG 中 的 这 样 一 条 路 径 被 指定 为 保证 路 径 ， 且 nb(p，b) 表示 该 保证 路 径 上 的 下 一 个 缓冲 
区 。 对 于 每 一 个 4 中 新 产生 的 包 p， 存 在 u 中 指定 的 合适 颖 冲 区 D(p)。 

1X Hb Aln bi xt 4 Hl RE % — 8 >} B (first buffer) 和 下 一 缓冲 区 (next buffer) 的 首 字 母 而 得 。 
观察 而 得 ， 缓 冲 区 nb(p，) 总 是 适合 于 p。 本 节 所 用 的 所 有 缓冲 图 中 ，nb(p，b) 所 驻 留 的 节点 
不 同 于 b 所 驻 留 的 节点 。BG 中 “内 部 ” 边 的 使 用 ， 即 ， 同 一 节点 的 两 个 缓冲 区 之 间 的 边 ， 将 
稍 后 讨论 。 

1. 缓冲 图 控制 器 

缓冲 图 8BG 可 用 于 实现 无 死 锁 的 控制 器 bgcsc， 如 果 缓 冲 区 mbp(p, b) 按 照 每 一 个 包 编 码 ， 或 
者 按照 p 所 驻 留 的 节点 状态 编码 。 

定义 5.6 控制 器 bgcsc 定 义 如 下 。 

(1) 当 且 仅 当 组 冲 区 /pp) 为 空 时 ，u 中 可 以 产生 包 p。 如 果 产 生 包 ， 则 放 入 此 缓冲 区 中 。 

(2) 当 且 仅 当 w 中 的 nb(p, DAZA, CphuP HF LHR Sw PHBH eR (可 能 4 = w)。 
如 果 发 生 转 发 ， 则 将 p 放 入 nb(p，b) 中 。 

定理 5.7 控制 器 bgcso 是 无 死 镇 的 控制 器 。 

证 明 。 如 果 节 点 u 的 缓冲 区 都 为 空 ， 可 允许 4 中 产生 包 ， 这 蕴含 着 ，bgesc 是 控制 器 。 
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对 于 b EB, RMBGHERFOORKMAKES LOMB. WHA, BOLE 
上 (尤其 是 在 保证 路 径 上 ) 的 缓冲 区 的 缓冲 级 严格 递增 ， 即 ，mb(P，5) 的 缓冲 级 大 于 的 组 
冲 级 。 

由 于 控制 器 只 人 允许 将 包 放置 在 合适 的 缓冲 区 中 ， 并 且 初 始 时 没有 包 ，bgcsc 下 ， 网 络 的 每 
种 可 达 配置 只 包含 合适 缓冲 区 中 的 包 。 通 过 对 缓冲 级 运用 向 下 归纳 法 ， 容 易 证 明 ， 在 这 种 配 
置 下 ， 缓冲 级 /的 缓冲 区 不 包含 死 锁 包 。 设 R 是 最 高 的 缓 促 级 ， 

情形 + = R:BG 中 具有 最 高 缓冲 级 的 节点 x 的 缓冲 区 /没有 输出 边 。 因 此 ， 对 于 4 为 合适 缓冲 
区 的 包 ， 当 它 在 5 中 时 可 被 消耗 ， 其 目的 节点 为 v。 由 此 可 得 ， 缓 冲 级 为 R 的 缓冲 区 不 含 死 锁 包 。 

情形 + < R: 由 归纳 假设 ， 对 于 每 一 满足 条 件 r < "< R 的 "， 缓冲 级 为 r 的 缓冲 区 不 含 死 
锁 包 (在 可 过 配置 中 )。 

设 y 是 可 达 配置 ， 其 中 包 p 在 节点 4 的 缓冲 级 r< R 的 缓冲 区 bp 中 ， 如 果 v 是 p 的 目的 节点 ， 那 
么 p 可 被 消耗 ， 因 此 不 会 死 锁 。 否 则 ， 设 nb(p，b) = < 是 从 5 开始 的 保证 路 径 上 的 下 一 缓冲 区 ， 
观察 可 得 ，< 的 缓冲 级 超过 r。 由 归纳 假设 ，c 不 含 死 锁 包 ， 因 此 存在 由 y 可 达 的 配置 6， 其 中 < 
为 空 。 在 5 中 ，p 可 迁移 到 c， 由 归纳 假设 ， 在 所 得 配置 6 中 ，p 不 会 死 锁 。 因 此 p 在 y 中 不 会 死 
锁 。 














由 证 明 过 程 可 见 ， 如 果 保 证 路 径 上 包含 缓冲 图 的 “内 部 ” 边 (同一 节点 两 个 缓冲 区 之 间 
的 边 )， 那 么 ， 控 制 器 一 定 允 许 另 外 的 迁移 ， 使 得 包 可 以 被 放 在 同一 节点 的 其 他 缓冲 区 中 。 通 
常 保证 路 径 并 不 包含 这 样 的 边 。 它 们 仅 被 用 作 可 选 的 迁移 ， 以 增加 转发 的 效率 。 例 如 ， 下 列 
所 述 情形 。 包 p 驻 留 在 节点 4 的 缓冲 区 b 中 。 节 点 w 的 缓冲 区 nb(p，b1) 被 占据 。 然而， 存在 4 
中 的 空 缓 圳 区 bs 适合 于 p， 而 且 节 点 w 中 的 nb(p，b,) 为 空 。 在 这 种 情况 下 ， 包 经 过 过 如 和 nb 
(p，b;) 进行 迁移 。 

下 面 讨论 两 个 缓冲 图 应 用 的 例子 ， 即 目的 节点 模式 和 当前 跳 数 模式 。 

2. 目的 节点 模式 

目的 节点 模式 用 每 个 节点 x 中 的 N 个 缓冲 区 ， 用 缓冲 区 fy] 表示 每 个 可 能 的 目的 节点 v。 称 
节点 ?为 缓冲 区 包罗] 的 目标 。 假 设 这 种 模式 的 路 由 算法 ， 经 过 根 向 v 的 有 向 树 陈 转发 目的 节点 为 
v 的 所 有 包 。( 实际 上 ， 这 种 假设 可 以 放松 。 它 满足 向 着 v 路 由 所 用 的 信道 形成 G 的 无 环 子 图 。) 

用 BGs = (B, BE) 定义 缓冲 图 ， HH, bv] bev] © BE, 4 HL %y, = w 且 ww 是 7 中 
的 一 条 边 。 为 表明 BGs 是 无 环 的 ， 观 察 可 见 ， 不 同 目标 的 缓冲 区 之 间 不 存在 边 。 同 一 目标 v 的 
缓冲 区 之 间 形 成 与 7, 同 构 的 一 棵 树 。 终 点 为 的 每 一 条 路 径 P E PETRA. ate, 
BG. 中 存在 目标 为 v 的 缓冲 区 路 径 ， 其 映像 为 P。 选 此 路 径 作为 保证 路 径 。 这 表明 ， 对 于 目的 
节点 为 v 的 包 p， 在 节点 u 中 产生 ，fb(p) = bs[v]。 如 果 包 必须 被 转发 到 w， 则 nb(p，b) 
= bv]. 

定义 5.8 控制 器 dest 被 定义 为 bgcac ， 放 和 nb 如 前 段 定 义 。 

定理 5.9 对 于 每 个 节点 上 使 用 N 个 比 冲 区 的 任意 连 通 网 络 ， 且 多 许 包 经 任意 选 定 的 汇集 
树 路 由 ， 则 存在 无 死 锁 的 控制 器 。 

证 明 。dest 就 是 使 用 缓冲 区 数 的 无 死 锁 的 控制 器 。 口 

如 前 所 述 ， 对 于 经 过 汇集 树 路 由 的 要 求 可 放松 到 ， 经 过 形成 无 环 图 的 信道 发 送 朝 向 其 一 
目的 节点 的 包 。P 只 包含 简单 路 径 是 不 足够 的 。 正 如 图 5-2 所 示 的 例子 所 表明 的 那样 。 这 里 从 
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Ui 到 v 的 包 经 过 简单 路 径 <u;，wi，u,。，...，v> 路 由 ， 从 tw 到 v 的 包 经 过 简单 路 径 <us，w2，u1l，.…， 
v> 路 由 。P 中 每 条 路 径 是 简单 的 ， 将 包 路 由 到 v 所 用 到 的 全 部 信道 的 集合 包含 回路 <ul1，wi， 
Ur, Wr, UI>o 

控制 器 dest 简 单 易 用 ， 但 缺点 是 要 求 每 个 节点 有 大 量 缓 冲 区 N。 可 以 定义 双重 源 模式 ， 其 
中 以 vj 为 下 标的 缓冲 区 用 来 存储 在 v; 中 产生 的 包 。 

3. 当前 跳 数 模式 (hops-so-far) 

在 当前 跳 数 模式 中 ， 节 点 4 包含 kt1 个 组 
冲 区 b,[0] ，.….，bs[k]。 假 设 每 个 包 有 一 个 跳 数 
(hop count)， 用 以 表明 包 从 源 节 点 开始 已 经 
做 了 多 少 次 跳跃 。 

HBG (B, BE) 定义 缓冲 图 ， 其 中 ， 
bali] bul] © BE， 当 县 仅 当 二 1 = jHLuwee, 图 5-2 控制 器 dest 禁 止 的 路 由 
为 表明 BGs 是 无 环 的 ， 观 察 可 见 ， 缓 冲 区 的 下 标 沿 着 8Gs 中 的 每 条 边 严 格 递 增 。 因 为 加 中 的 每 
条 路 径 至 多 有 # 个 跳 数 长 ， 因 此 ， 缓 冲 图 中 存在 对 应 的 路 径 ; 如 果 P = uy, ..., w (1 < k) 那 


么 ， 





b,,(0}.b,, {1],....b, [1] 


是 8G4 中 像 为 P 的 一 条 路 径 。 用 fb(p)= b,[0] (pup Æ) Finb(p, b lil) = bli+1] ( 包 
必须 从 u 转 发 到 w) 描述 这 条 保证 路 径 。 

定义 5.10 控制 器 hsf 定 义 为 bgcso  Jofenb ERR. 

定理 5.11 对 于 每 个 节点 上 利用 D+1 个 缕 冲 区 (DD 是 网 络 直径 ) 的 任意 连通 网 络 ， 并 且 要 
求 用 最 小 跳 数 路 径 发 送 包 ， 看 在 无 死 镇 的 控制 器 。 

证 明 。 由 最 小 跳 数 路 径 可 得 ,k= D。hsf 是 每 个 节点 上 使 用 D+1 个 缓冲 区 的 无 死 锁 控制 器 。 
《如 果 距 离 较 大 的 节点 之 间 不 需 交 换 包 ， 缓 冲 区 数 还 可 更 小 。) o 

FE SARS, A FERREE TA LARRE. RHR ER 
下 一 跳 数 (hops-to-go) 模式 ， 其 中 以 i 为 下 标的 缓冲 区 用 于 存储 有 i 个 以 上 朝向 其 目的 节点 的 
跳 数 的 包 。 参 见习 题 5.3。 


5.2.2 图 G 的 定向 





全 市 考 虑 一 种 构造 复杂 缓冲 图 的 方法 ， 每 个 节点 只 需 几 个 缓 促 区 。 在 当前 跳 数 控制 器 中 ， 
存储 包 的 缓冲 区 的 下 标 随 着 每 次 跳跃 增加 。 现 在 假设 缓冲 区 下 标 (不 要 与 缓冲 级 混淆 ) 只 随 
某 些 跳跃 增加 ， 不 必 随 着 所 有 跳跃 而 增加 ， 这 样 可 以 减缓 缓冲 区 下 标的 增长 (也 就 减 小 了 每 
个 节点 缓冲 区 的 总 量 )。 为 避免 缓冲 图 中 的 回路 ， 那些 遍历 中 不 增加 缓冲 区 下 标的 信道 形成 无 
环 图 。 

定义 5.12 G 的 无 环 定向 是 对 G 中 所 有 边 进 行 定向 所 得 的 有 向 无 环 图 。 参 见 图 5-3。 

G 的 无 环 定向 序列 G1，...，Gs 是 路 径 集 合 亿 的 大 小 为 的 无 环 有 向 荐 盖 ， 如 果 对 于 每 条 路 
径 PEP， 都 可 以 写成 B 条 路 径 P1，...，Ps 的 连接 ， 其 中 忆 是 Gi 中 的 一 条 路 径 。 

当 大 小 为 8 的 无 环 有 向 覆盖 可 用 时 ， 可 以 构造 每 个 节点 上 只 使 用 B 个 缓冲 区 的 控制 器 。 包 
总 是 在 节点 zx 的 缓冲 区 [1] 中 产生 。 如 果 u 和 w 之 疗 的 边 是 G; 中 朝向 w 的 有 向 边 ， 缓 冲 区 b, 四 中 
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A) LA ABE BIA Rw, FRERIK ip. WR RAEG, Bop, 
bb 中 的 包 必 须 被 转发 到 节点 w， 并 放 在 缓冲 区 5b,li+1] 中 。 
定理 5.13 RAD ABHP FH 
REAR AAS, 那么 ， 存 在 无 死 锁 
的 控制 器 ， 该 控制 器 仅 使 用 每 个 节点 


上 的 B 个 缓冲 区 。 
证 明 。 设 C,，…，Gs 是 这 个 无 环 有 
向 覆盖 ，b,[1]，..….，b.[B8] 是 节点 u 的 缓 图 5-3 图 与 无 环 方向 图 


溃 区 。 如 果 边 uw 是 Gi 中 朝向 w 的 有 向 边 ， 
则 记 为 wwE 所 。 如 果 边 ww 是 Gi 中 朝向 u 的 有 向 边 ， 则 记 为 wuE E LB HRY, = (B, 
BE), HF, bdil 6,1 EBE， 当 且 仅 当 4w CEH (i=j A uw EE) 或 者 (itl =j A wu EE). 
为 了 表明 图 是 无 环 的 ,注意 不 存在 包含 不 同 下 标的 缓冲 区 的 回路 ， 这 是 因为 从 给 定 缓冲 区 到 
另 一 个 具有 较 小 下 标的 缓冲 区 之 间 不 存在 边 。 具 有 同一 下 标 ;的 缓冲 区 也 不 存在 回路 ， 因 为 这 
些 缓冲 区 按照 无 环 图 G 排 列 。 

对 于 每 一 P € PP ， 存 在 像 为 P 的 保证 路 径 的 证 明 留 给 读者 (参见 习题 5.4)。 用 下 列 的 定义 
描述 这 样 一 条 路 径 : 

fo(p) = b, (1) 
won 人 全 

定义 了 每 个 节点 上 有 8 个 缓冲 区 的 缓冲 图 ， 我 们 可 以 得 出 结论 ， 存 在 每 个 节点 上 使 用 B 个 
缓冲 区 的 控制 器 。 定 理 证 毕 。 

我 们 称 所 得 到 的 控制 器 类 为 无 环 有 向 徐 盖 控制 器 ， 或 者 简称 AOC 控 制 器 。 以 下 继续 表明 ， 
利用 无 环 有 向 覆盖 很 容易 设计 控制 器 。 

1. 环 上 的 包 交 换 

无 环 有 向 种 盖 可 用 于 设计 几 类 网 络 的 无 死 锁 控制 器 。 首 先 给 出 环 上 的 控制 器 ， 每 节点 只 
需 使 用 3 个 缓冲 区 。 以 下 定理 假设 ,信道 的 权 值 对 称 ， 即 w,, =u 














de(u, v) ~ da(u, v) 


QQG 


图 5-4 环 的 无 环 方向 巴 盖 
定理 5.14 对 于 每 个 节点 有 3 个 缓冲 区 并 克 许 使 用 最 短路 径路 由 包 的 环 网， 存在 无 死 镇 的 
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控制 器 。 

证 明 。 由 定理 5.13 ， 对 于 每 对 节点 间 包 含 最 短路 径 的 路 径 集合 ， 足 以 给 出 大 小 为 3 的 无 环 
有 向 覆盖 。 

利用 以 下 表示 。 对 于 节点 uv，d.(u，v) 表示 从 4 到 v 的 顺 时 针 路 径 长 度 ，d,(u，v) 表示 
“从 4 到 v 的 逆 时 针 路 径 长 度 , d.(v, u) = ds(u, v) Hd(u, v) = min(d. (u, v), dalu, v)) 成 
了 立 。C 为 所 有 信道 权 值 总 和 【〈 环 的 周 长 )， 显 然 ， 对 于 所 有 x 和 v， de(u, v) +d,(u, v) = 
Alittd(u, v)<C/2, 

首先 考虑 简单 情况 。 存 在 节点 x 和 v， 满 足 4(u,，v) = C/2。G1 和 G; 由 所 有 指向 v 的 边 组 成 ， 
G; 由 所 有 指向 x 的 边 组 成 ， 参 见 图 5-4。 

从 u 到 v 的 最 短路 径 包 含 在 G1 或 者 G; 中 ， 从 v 到 4 的 最 短路 径 包含 在 Gs 中 。 设 x，y 是 不 等 于 4、 
vy 的 节点 对 。 则 当 d(x，y) < C/2， 存 在 节点 x* 和 y 之 间 的 最 短路 径 P， 不 包含 x 和 v。 如 果 P 既 不 
包含 4 也 不 包含 "， 则 该 条 路 径 要 么 完全 在 G6; 中， 要 么 完全 在 G; 中 。 如 果 P 包 含 "， 则 该 条 路 径 
是 G1 中 的 一 条 路 径 与 G6; 中 的 一 条 路 径 的 连接 。 如 果 P 包 含 x， 则 它 是 6G; 中 的 一 条 路 径 与 G; 中 的 
一 条 路 径 的 连接 。 

如 果 不 存在 节点 wu 和 v， 满 足 4(u，v) = C/2。 选 择 路 径 d(w，”) 与 C/2 尽 可 能 接近 的 点 对 。 
可 以 表明 ， 如 果 存 在 点 对 x*，y， 满 足 在 方向 覆盖 中 ， 不 存在 最 短路 径 作为 路 径 连接 ， 那 么 较 
Zd(u, v), d(x, y) 更 接近 C/2。 

2. 树 上 的 包 交 换 

无 处 有 向 覆盖 可 用 于 构造 每 节点 有 2 个 缓冲 区 的 树 网 的 控制 器 。 

定理 5.15 对 于 每 个 节点 有 2 个 缓冲 区 的 树 网 ， 存 在 无 死 镇 的 控制 器 。 

证 明 。 由 定理 5.13， 对 于 包含 所 有 简单 路 径 的 树 ， 足 以 给 出 无 环 有 向 图 。 任 选 节点 r， 通 
过 将 所 有 边 指 向 r， 得 7， 通过 将 所 有 边 背 离 ?-， 可 得 T,， 参 见 图 5-5。 从 4 到 v 的 简单 路 径 ， 是 
从 zx 到 最 小 公共 祖先 〈 在 7 中 ) 的 路 径 与 从 最 小 公共 祖先 到 v (在 7 中 ) 的 路 径 的 连接 。 口 

这 里 所 描述 的 模式 可 用 于 任意 网 络 的 (最 小 深度 ) 生成 树 中 。 实 际 上 我 们 已 经 表明 ， 
对 于 每 个 节点 上 有 2 个 缓冲 区 的 网 络 ， 可 能 存在 无 死 锁 的 路 由 。 路 由 所 用 路 径 一 般 而 言 不 是 
最 优 的 。 














T T T2 


图 5-5 树 的 无 环 方向 巴 盖 

3. AOC 控 制 器 的 应 用 

环 的 例子 表明 ， 使 用 AOC 控 制 器 ， 需 要 确定 进行 消息 路 由 的 具体 路 径 集合 。 这 样 引 出 了 
几 个 问题 ， 在 过 去 的 若干 年 里 ， 人 们 一 直 在 研究 这 些 问 题 。 

有 可 能 只 用 最 少量 的 缓冲 区 又 通过 最 优 路 径 同 时 路 由 包 吗 ”如 果 不 可 能 ， RERE 
和 效率 之 间 做 出 权衡 呢 ? Stefankovic[Ste99] iE HA, AOC 控 制 器 在 缓 神 区 的 使 用 方面 效率 较 低 。 
他 给 出 了 一 类 网 络 ， 在 每 个 节点 上 使 用 常数 量 的 缓冲 区 ， 可 以 进行 无 死 锁 的 最 优 路 由 。 但 是 
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最 好 的 最 优 AOC 控 制 器 需要 Q (lgN/lglgN) 个 缓冲 区 。 最 好 的 AOC 控 制 器 和 最 好 的 控制 器 之 
间 的 差距 尚 不 得 而 知 。 

用 压缩 路 由 模式 ， 如 区 间 路 由 ， 可 对 AOC 控 制 器 中 使 用 的 路 径 编 码 吗 ? 对 于 超 立 方 体 ， 
可 知 (1) 存在 最 优 区 间 标 号 模式 ，(2) 存在 利用 最 优 路 径 的 控制 器 ， 每 节点 只 需 2 个 缓冲 区 ， 
但 是 (3) 对 于 只 需 2 个 缓冲 区 ， 并 且 所 用 最 优 路 径 利 用 区 间 标 号 模式 编码 的 AOC 控 制 器 是 不 
存在 的 。 这 个 领域 的 大 量 研究 仍然 在 进行 。 


5.3 无 结构 的 方法 


我 们 将 要 讨论 由 Toueg 和 Ullman[TU81] 提 出 的 一 类 控制 器 。 这 些 控制 器 并 不 规定 包 必须 被 
放 进 哪 一 个 缓冲 区 ， 并 且 它 们 只 用 简单 的 局 部 信息 ， 如 ， 跳 数 或 者 节点 所 占据 的 缓冲 区 数 。 


5.3.1 前 向 计数 控制 器 和 后 向 计数 控制 器 


1. 前 向 计数 控制 器 

对 于 包 P， 设 s* 是 到 目的 节点 仍 需 进 行 的 跳 数 。 显 然 ，0 < w < 成立。 在 包 中 并 不 必 总 是 
维持 s,， 因 为 许多 路 由 算法 将 这 一 信息 存储 在 每 一 节点 中 。 如 4.3 节 的 变更 算法 。 对 于 节点 4， 
表示 wu 中空 缓冲 区 数 。0 <fi < 8B 总 是 成 立 。 

定义 5.16 前 向 计数 控制 器 FC 在 节点 4 中 接受 包 ， 当 且 仅 当 s, <f. 

如 果 节 点 上 包含 的 空 缓冲 区 数 比 要 进行 跳跃 的 包 多 ， 则 控制 器 接收 包 。 

定理 5.17 如 果 B >k， 那 么 ，FC 是 无 死 锁 的 控制 器 。 

证 明 。 为 证 明 在 空 节点 上 可 以 产生 包 ， 观 察 可 得 ， 如 果 u 中 所 有 缓冲 区 为 空 ， 则 f, = B. 
新 包 至 多 要 进行 k 次 跳跃 ， 因 此 B > k 蕴 含 包 被 接收 。 

用 反 证 法 证 明 FC 的 无 死 锁 性 。 假 设 y 是 控制 器 的 一 种 可 达 死 锁 配 置 。 将 y 用 于 最 大 转发 和 
消耗 迁移 序列 上 ， 得 到 配置 6。 在 6 中 包 不 能 迁移 。 因 为 y 是 死 锁 配置 ， 在 配置 6 中 ， 至 少 存在 
一 个 包 被 留 下 。 设 p 是 6 中 到 目的 节点 最 小 距离 的 包 ， 即 ，s, 是 6 中 任何 包 的 最 小 值 。 

设 u 是 包 p 所 驻 留 的 节点 。 由 于 4 不 是 p 的 目的 节点 (否则 ，p 在 6 中 被 消耗 )、 则 必须 将 p 转 
发 至 w，w 是 wu 的 近邻 。 因 为 在 FC 中 不 允许 这 种 迁移 ， 

s- f, 

HAs <k, hiRit, k<B, KBAR, f.< B， 这 表明 至 少 有 一 个 包 驻 留 在 配置 6 的 w 中 。 
在 % 的 所 有 包 中 ， 设 4 是 w 最 新 接收 的 包 , ', 表 示 w 接 收 q 之 前 的 w 中 空 缓冲 区 数 。 因 为 包 g 现 在 
占据 这 些 f , 空 缓冲 区 之 一 ，( 由 gq 的 选择 ) w 中 在 g 之 后 所 接收 的 包 都 被 去 除 ， 因 此 f wSfy +1. 

wiki, Bas, < ,， 结 合 三 个 导出 的 不 等 式 ， 可 得 

s< fo <f, tics, 

这 与 p 的 选择 矛盾 。 口 

2. 后 向 计数 控制 器 

当 按 照 包 已 做 过 的 跳 数 来 决定 包 的 接收 时 ， 就 得 到 对 FC 的 “双重 ”控制 器 。 et, At pM 
BAF te CET HB. BIR, O<1, < kL RY. 

定义 5.18 后 向 计数 控制 器 BC 在 节点 u 中 接受 包 p， % AAR Ht, > k-f, 。 





PSE LARGER 101 


BC 是 无 死 锁 控制 器 的 证 明 (习题 5.6) 非常 类 似 于 定理 5.17 的 证 明 。 
5.3.2 前 向 状态 控制 器 和 后 向 状态 控制 器 


通过 利用 驻 贸 在 节点 中 的 更 多 信息 ， 可 以 给 出 类 似 于 前 向 计数 控制 器 的 控制 器 ， 但 这 样 
的 控制 器 允许 更 多 迁移 。 
1. 前 向 状态 控制 器 ` 
SAIS AARE. EMH RuRAMBA<jo, -o Je, Hy dub pte, B 
Sp = So 
定义 5.19 前 向 状态 控制 器 FS 在 节点 u 中 接收 状态 向 量 为 <jo，.…， 有 > 的 包 pP， 当 且 仅 当 
V,0< i <s,:i<B- Si, 


定理 5.20 如 果 甩 > 上 大， 那么，FS 是 无 死 镇 的 。 

证 明 。 空 节点 接受 每 个 包 留 给 读者 证 明 。 假 设 存在 可 达 的 死 锁 配 置 y， 通 过 使 用 最 大 转发 
序列 和 消耗 迁移 ， 得 到 配置 5。 在 6 中 包 不 能 迁移 ， 且 至 少 存在 一 个 包 被 留 在 85 中。 选择 具有 最 
小 ss 值 的 包 p。 设 u 是 p 所 驻 留 的 节点 ，w 是 p 必 须 向 其 转发 的 节点 。 设 < 训 ，.….，j > 是 6 中 w 的 状 
Si. 

如 果 w 没 有 包含 包 ， 那 么 Si i= 0, 这 理 含 着 w 能 够 接受 p， 然 而 ,情况 并 非 如 此 。 因 此 ， 
#% 至 少 包含 一 个 包 ， 在 w 的 所 有 包 中 ， 设 4 是 到 目的 节点 最 近 距 离 的 包 ， 即 y = min{s: j, > 0}. 
要 证 ss < sy， 这 是 一 个 矛盾 。 

在 w 的 所 有 包 中 ， 设 r 是 w 最 新 接收 的 包 ， 则 ss < 5, 成 立 。 设 < 5 ，...，j' > 是 接收 r 之 前 w 中 
的 状态 向 量 。r 的 接收 藏 含 着 


` k 
Wi0 Si <s :i<B- Yh 


当 < jo o J > 是 w 的 状态 向 量 时 ，w 接 收 r-。 其 后 ， 此 包 可 从 w 中 迁移 ， 但 是 所 有 在 r 之 
后 接收 的 包 已 经 被 删除 (由 :的 选择 )， 这 蕴含 着 


jj 对 于 s = s, 
i, <i’, +l 


k 
V,,0 <i <5,:1<B-})j, +1 


Ri = s, 


现在 利用 w 没 有 接受 p 的 事实 ， 即 ， 
,0 <i <5,-12i, > Bp- Yi 


由 此 得 不 等 式 


Sp >S,—1 








> io 如 上 所 述 
> 8- Sie 如 上 所 述 


> B- >. ,六 因为 > 0 (Hi > 0) 


k . 
> B- $., Js 因为 六 = 0 对 于 s < Sy 
2 Sy 











是 所 要 求 的 矛盾 结果 。 
2. 后 向 状态 控制 器 
与 后 向 状态 控制 器 比较 ， 前 向 状态 控制 器 利用 更 详细 的 信息 并 允许 更 多 迁移 。4, 的 含义 如 
前 所 述 。 定 义 节 点 4 的 状态 向 量 为 <io，.….，ir>， 其 中 i 是 u 中 已 经 做 过 坎 跳跃 的 包 的 数目 。 
定义 5.21 后 向 状态 控制 器 BS 在 节点 4 中 接收 状态 向 量 为 <ios，...，ii> 的 包 p， 当 且 仅 当 





i 
Vit, Sj Skim Di -B+k 


BS 是 无 死 锁 控制 器 的 证 明 非 常 类 似 于 定理 5.20 的 证 明 。 

3. 两 种 控制 器 的 比较 

在 某 种 意义 上 ， 由 于 前 向 状态 控制 器 允许 更 多 迁移 ， 因 此 前 向 状态 控制 器 比 前 向 计数 控 
制 器 更 宽松 。 

引 理 5.22 FC 所 克 许 的 每 次 迁移 ，FS 也 允许 。 

证 明 。 假 设 FC 人 允许 4 接收 包 p。 那么，s, < 所 = B- Di» ARM FI < s i<B- Sy, 
成 立 ， 这 效仿 着 FS 允许 迁移 。 a 

文献 [TU81] 中 表明 ，FC 比 BC 更 宽松 ，FS 比 BS 更 寅 松 ，BS 比 BC 更 宽松 。 经 证 明 ， 在 利 
用 同样 信息 的 控制 器 中 ， 这 4 种 控制 器 的 每 一 种 都 可 能 是 最 宽松 的 控制 器 。 


5.4 需 进一步 研究 的 问题 


本 章 所 述 的 结论 ， 控 制 器 所 需 的 缓冲 区 数 总 是 起 着 重要 作用 。 通 常 存在 这 种 情况 ， 如 果 有 
更 多 缓冲 区 可 用 ， 则 吞吐 量 增加 。 在 无 结构 的 方法 中 ， 对 于 缓冲 区 数目 只 有 很 低 的 限定 ， 无 
需 任何 修改 ， 即 可 使 用 更 大 数目 的 缓冲 区 ， 缓 冲 图 中 可 静态 或 者 动态 地 插入 附加 缓冲 区 。 如 
采 静 态 插入 ， 每 一 缓冲 区 在 缓冲 图 中 有 固定 的 位 置 ， 即 ， 构 造 的 缓冲 图 比 5.2 节 提供 的 例子 
更 宽 %。 除 了 单一 缓 促 区 fb(p) 或 者 nb(p，b) 之 外 ， 通 常 要 确定 几 个 缓冲 区 ， 以 备 路 径 开始 
或 继续 穿 过 缓冲 图 时 使 用 。 如 果 附 加 缓冲 区 是 动态 插 人 的 ， 缓 冲 图 的 构造 首先 要 包含 尽 可 能 
少 的 缓冲 区 。 我 们 称 图 中 的 缓冲 区 为 过 辑 缓冲 区 。 在 操作 中 ， 每 个 实际 的 缓冲 区 ( 称 为 物理 
缓冲 区 ) 可 作为 逻辑 缓冲 区 用 。 其 中 必须 保证 ， 对 于 每 个 逻辑 缓冲 区 ， 至 少 有 一 个 物理 缓冲 
区 扮演 它 的 角色 。 为 避免 死 锁 ， 用 这 种 方法 只 需 预 留 少量 的 缓冲 区 。 其 余 缓冲 区 可 灵活 使 用 。 

本 章 假 设 包 的 大 小 固定 : 缓冲 区 的 大 小 相等 ， 且 只 能 包含 一 个 包 。 也 可 假设 包 的 大 小 不 
同 来 考虑 此 问题 。5.3 节 的 方法 适合 于 Bodlaender 提 出 的 假设 ， 参 见 文献 [Bod86]。 


5.4.1 拓扑 变化 
至 今 为 止 ， 我 们 还 没有 考虑 ， 在 包 从 源 节 点 到 目的 节点 路 由 的 过 程 中 ， 网 络 拓扑 结构 发 
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生变 化 的 可 能 性 。 在 出 现 这 种 变化 后 ， 每 个 节点 的 路 由 表 将 被 更 新 ， 然 后 利用 路 由 表 中 变化 
后 的 值 对 包 进 行 转发 。 修 改 路 由 表 的 结果 是 ， 包 行进 的 路 径 ， 可 能 是 路 由 表 变 化 之 前 从 未 有 
过 的 路 径 。 也 可 能 是 这 种 情况 ， 包 的 最 终 路 由 包含 回路 。 

本 章 讨论 的 其 对 避免 死 锁 的 方法 所 产生 的 影响 与 直觉 恰恰 相反 。Dest 控 制 器 ， 可 以 不 加 
修改 的 应 用 ， 其 正确 性 取决 于 刀 所 具有 的 只 包含 简单 路 径 的 性 质 。 只 对 路 径 跳 数 上 界 作出 假 
设 的 控制 器 ， 当 用 于 这 种 情况 时 ， 需 要 关注 其 他 一 些 问 题 。 

1. 控制 器 Dest。 

在 最 新 拓扑 结构 变化 后 的 有 限时 间 内 ， 路 由 表 已 经 收敛 到 无 回路 的 路 由 表 。 在 路 由 表 的 
计算 过 程 中 ， 即 使 存在 回路 等 待 的 情形 ， 当 计算 完成 时 ， 缓 冲 图 再 次 无 回路 ， 所 有 包 被 存储 
在 合适 的 缓 促 区 中 。 因 此 路 由 表 收 敛 到 不 含 死 锁 包 的 最 终 配 置 。 

2. 跳 数控 制 器 

考虑 一 个 控制 器 ， 它 所 依赖 的 假设 是 包 至 多 做 上 次 跳跃 。 可 以 选择 足够 大 的 k， 即 使 在 包 
从 源 节 点 到 目的 节点 遍历 的 过 程 中 ， 出 现 某 些 拓扑 变化 ， 也 会 以 大 概率 保证 每 个 包 在 上 次 跳跃 
内 到 达 目 的 节点 。 对 于 在 k 个 跳 数 之 内 到 达 目 的 节点 的 所 有 包 ， 当 前 跳 数 、 后 向 计数 和 后 向 状 
态 控制 器 可 以 不 加 修改 的 应 用 。 但 是 总 有 可 能 ， 由 于 拓扑 变化 和 路 由 表 的 更 新 ， 使 得 一 个 包 
不 能 在 k 次 跳跃 之 内 到 达 目 的 节点 。 如 果 这 种 情况 发 生 ， 包 就 被 存储 在 一 个 不 合适 的 缓冲 区 中 ， 
它 将 永远 被 阻塞 在 一 个 与 目的 节点 不 同 的 节点 中 。 

利用 有 协议 层次 的 高 级 协议 ， 仍 然 可 以 解决 这 类 问题 。 最 简单 的 解决 办 法 是 丢弃 这 个 包 。 
从 端 到 端 传输 协议 的 观点 来 看 ， 包 现在 丢失 了 。 但 是 传输 层 可 以 解决 这 种 损失 。 参 见 3.2 池 。 

为 实现 3.2 节 所 做 的 假设 ， 即 包 的 最 大 生存 期 为 &， 委 弃 包 也 是 需要 的 。 如 果 转 发 包 的 时 
间 至 少 为 we， 对 于 包 的 端 到 端的 生存 期 4 的 限定 ,蕴含 着 对 包 所 能 进行 的 跳 数 的 界定 上 为 
Hl hoo 


5.4.2 其 他 类 型 的 死 锁 


本 章 只 考虑 了 一 种 存储 转发 的 死 锁 。 如 果 5.1 节 所 做 的 假设 是 有 效 的 ， 则 存储 转发 死 锁 是 
惟一 能 够 出 现 的 死 锁 类 型 。 然 而 ， 在 实际 的 网 络 中 ， 不 能 总 是 证 明 这 些 假设 是 正确 的 ， 正 如 
Merlin 和 Schweitzer[MS80b] 所 指出 的 那样 ， 这 可 能 引起 其 他 类 型 的 死 锁 。Merlin 和 Schweitzer 
考虑 了 4 种 类 型 的 死 锁 ， 即 ， 子 代 死 锁 、 版 本 复制 死 锁 、 调 步 死 锁 和 装配 死 锁 。 并 表明 通过 扩 
展 缓 冲 图 的 方法 可 以 避免 这 些 死 锁 。 

1. 子 代 死 锁 

当 网 络 中 的 包 p 能 建立 另 一 个 包 q 时 ， 可 能 出 现 子 代 死 锁 。 例 如 ， 如 果 遇 到 信道 发 生 故障 ， 
就 向 源 节点 报告 。 这 就 在 新 产生 的 包 g 和 现 有 包 p 的 转发 或 消耗 之 间 ， 强 加 了 一 种 因果 关系 。 
这 就 违背 了 5.1 节 的 假设 ， 即 网 络 总 是 允许 包 的 转发 和 消耗 。 

可 以 通过 复制 两 个 缓冲 图 来 避免 子 代 死 锁 。 一 个 用 来 记录 原始 信息 ， 另 一 个 用 来 记录 子 
代 的 次 要 信息 。 如 果子 代 又 建立 了 子 代 ， 也 可 以 利用 多 级 缓冲 图 。 

2. 版 本 复制 死 锁 

直到 接 到 目的 节点 接收 包 的 确认 消息 ( 端 到 端 )， 源 节点 还 持 有 包 的 副本 ， 这 时 可 能 引起 
版 本 复制 死 锁 。( 比较 3.2 节 基于 定时 器 的 协议 ， 并 假设 序列 in, 被 存储 在 与 被 路 由 机 制 用 作 临 
时 包 的 存储 空间 相同 的 存储 空间 中 。) 这 就 违背 了 5.1 节 的 假设 ， 即 当 占 据 缓冲 区 的 包 被 转发 


N 
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后 ， 缓 冲 区 应 该 为 空 。 

我 们 给 出 了 两 个 扩展 的 缓冲 图 法 则 。 用 这 些 法 则 可 以 避免 版 本 死 锁 。 第 一 种 方法 假设 ， 
只 要 循环 等 待 原始 消息 和 确认 消息 ， 就 会 出 现 版 本 复制 死 锁 。 解 决 办 法 是 将 确认 消息 作为 子 
代 ， 并 在 缓冲 图 中 存储 它们 的 单独 副本 。 第 二 种 方法 ， 在 大 多 数 情况 下 ， 只 需 较 少 缓冲 区 。 
新 产生 的 包 被 放 在 专用 的 源 节点 源 丝 冲 区 中 ， 其 中 不 能 放置 转发 包 。 

3. 调 步 死 锁 

当 网 络 包含 的 节点 具有 有 限 的 内 部 存储 区 时 ， 这 些 节点 在 其 他 一 些 消 息 被 产生 后 ， 才 消 
耗 消 息 ， 这 样 会 引发 调 步 死 锁 。 例 如 ， 电 传 打 字 机 终端 在 接收 下 一 些 字符 来 显示 之 前 ， 必 须 
先 要 输出 一 些 字符 。 这 违背 了 假设 : 目的 节点 上 的 包 总 是 被 消耗 。 

我 们 可 以 通过 区 别 可 调 步 的 (paceable) 包 和 调 步 (pacing) 响应 ， 来 避免 调 步 死 锁 。 例 
如 ， 直 到 产生 第 二 种 类 型 的 包 后 ， 前 一 种 类 型 的 包 才能 被 消耗 。 用 不 同 缓 串 图 的 副本 来 表示 
这 两 种 类 型 的 消息 。 

4. 装配 死 锁 

在 网 络 中 ， 将 消息 划分 成 小 包 进 行 传输 ， 直 到 所 有 包 达 到 目的 节点 时 才能 删除 包 ， 这 会 
引起 装配 死 锁 。( 比较 3.1 节 的 请 动 窗口 协议 ， 其 中 ， 仅 当 具 有 较 小 下 标的 所 有 字 被 接收 后 ， 
才 可 以 从 outs 中 删除 字 。) 这 违背 了 包 在 目的 节点 总 是 可 能 被 消耗 的 假设 。 


5.4.3 活 锁 


死 锁 包 的 定义 (定义 5.2) 蕴含 着 ， 在 无 死 锁 的 控制 器 下 ， 每 个 包 至 少 存 在 被 消耗 的 一 次 
计算 。 一 般 情况 下 ， 可 能 存在 大 量 的 不 同 计算 ， 这 并 不 蕴含 着 每 个 包 最 终 都 能 够 被 传递 到 目 
的 节点 。 即 使 有 无 限 次 计算 ， 如 图 5-6 所 示 。 假 设 节点 x 有 无 限 的 包 流 要 发 送 到 节点 v， 每 当 w 
中 的 缓冲 区 空 时 ， 就 接收 4 的 下 一 个 包 。 节 点 s 中 有 到 :的 包 ， 它 不 是 死 锁 的 ， 这 是 因为 ， 每 当 
» 中 的 一 个 缓冲 区 变 空 时 ， 就 有 继续 计算 的 可 能 性 。 其 中 w 接 收 包 ， 并 将 包 转发 到 :。 尽 管 这 种 
继续 是 可 能 的 ， 但 并 不 是 必须 这 样 做 。 因 此 包 可 能 永远 留 在 * 中 。 这 种 情况 称 为 活 锁 。 

可 以 扩展 本 章 所 讨论 的 控制 器 ， 以 避免 笑 锁 这 种 情况 。 

定义 5.23 ”给 定 网 络 ， 控 制 器 con 和 配置 y， 如 果 存 在 一 个 无 
限 的 迁移 序列 ， 在 Y 中 是 可 应 用 的 ， 且 p 在 其 中 不 被 消耗 ， 称 p 是 
活 锁 的 。 

如 果 它 包含 活 锁 包 ， 称 配置 ?为 活 镇 配置 。 在 控制 器 迁移 下 ， 
如 果 不 存在 活 镇 配置 ， 从 不 含 包 的 配置 可 达 ， 称 控制 器 是 无 活 镇 
的 。 

本 节 其 余部 分 ， 将 证 明 缓 冲 图 控制 器 的 无 活 锁 性 。 最 后 ， 简 
要 提出 了 无 结构 方法 的 扩展 。 

1. 缀 冲 图 控制 器 

可 以 证 明 ， 如 果 在 一 个 无 限 序 列 中 的 迁移 ， 满 足 许多 公平 性 假设 ，5.2 节 的 控制 器 不 加 修 
改 就 是 无 活 锁 的 控制 器 。F1 和 F2 是 强 公平 性 假设 ，F3 是 弱 公 平 性 假设 。 

Fl 如 果 试 图 连续 产生 包 p， 那 么 每 一 无 限 计算 都 包含 p 的 产生 ， 在 计算 中 心 (p) 在 无 限 多 

个 配置 中 是 空 的 。 





图 5-6 活 锁 示例 
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F2 如 果 在 配置 y 中 ， 包 p 必 须 经 从 x 转 发 到 mw， 那么 ， 在 7 中 开始 的 每 一 无 限 计 算 都 包含 p 
的 转发 ， 在 计算 中 nb(p，b) 在 无 限 多 个 配置 中 是 空 的 。 

F3 ”如果 包 p 在 配置 ?中 的 目的 节点 中 ， 那 么 ， 在 ?中 开始 的 每 一 无 限 计算 都 包含 p 的 消耗 。 

引 理 5.24 ”如 果 满 足 公 平 性 假设 F2 和 F3， 那 么 在 bgc 的 每 一 次 无 限 计 算 中 ， 每 一 缓冲 区 为 
空 的 次 数 无 限 。 . 

证 明 。 对 缓冲 级 用 向 下 归纳 法 证 明 。 正 如 在 定理 5.7 中 证 明 的 那样 ， 设 R 是 最 大 的 缓冲 级 。 
在 bge 下 可 达 的 配置 中 ， 所 有 包 驻 留 在 合适 的 缓冲 区 中 。 

情形 + = R: 级 R 的 缓冲 区 没有 出 边 ， 因 此 ， 在 这 样 的 缓冲 区 中 的 包 已 经 达到 目的 节点 。 
由 假设 F3， 每 次 配置 后 ， 这 样 的 一 个 缓冲 区 被 占据 。 存 在 配置 ， 其 缓冲 区 为 空 。 这 蕴含 着 在 
无 限 多 次 的 配置 中 ， 缓 冲 区 为 空 。 

情形 r < R: 设 y 是 一 种 配置 ， 其 中 级 r< R 的 缓冲 区 b 被 包 p 占 据 。 如 果 p 已 达 其 目的 节点 ， 
将 会 有 一 配置 ， 根 据 F3，、 其 中 的 bp 为 空 。 否 则 ，p 必 被 转发 到 缓冲 级 r' > /的 缓冲 区 nb(p，b) 中 。 
由 归纳 得 ， 在 7 中 开始 的 每 一 无 限 计 算 ， 该 缓冲 区 为 空 的 时 间 无 限 。 由 F2， 这 蕴含 着 ，p 将 被 
转发 ， 因 此 ，y 之 后 将 会 有 一 配置 ， 其 中 的 缓冲 区 2 为 空 。 

定理 5.25 如 果 满 足 公平 假设 F1、F2 和 F3， 那 么 ， 在 每 次 无 限 的 计算 中 ， 出 现在 网 络 中 
的 每 个 包 将 在 目的 节点 被 消耗 。 

证 明 。 由 引 理 5.24， 在 无 限 多 次 的 配置 中 ， 所 有 缓冲 区 为 空 。 由 F1， 这 理 含 着 ， 将 为 网 
络 不 断 地 提供 包 。 由 F2， 消 息 到 达 目 的 节点 就 会 被 转发 。 由 F3， 消 息 在 目的 节点 被 消耗 。 口 

有 人 会 假设 ， 在 分 布 式 系统 中 ， 非 确定 性 的 选择 机 制 保证 了 满足 三 条 公平 性 假设 。 可 供 
选择 的 是 ， 通 过 向 控制 器 加 入 一 种 机 制 来 执行 该 假设 ， 该 机 制 保证 ， 当 缓冲 区 为 空 时 ， 人 允许 
较 老 的 包 以 较 高 优先 级 进入 缓冲 区 。 

2. 无 结构 的 方法 

必须 修改 5.3 节 的 控制 器 ， 以 便 使 其 变 为 无 活 锁 的 。 通 过 构造 一 个 无 限 的 计算 可 以 对 此 加 
以 证 明 ， 在 这 个 无 限 的 计算 中 ， 连 续 的 包 流 导致 控制 器 禁止 某 些 包 的 转发 。Toueg[Tou80b] 给 
出 了 这 样 一 个 计算 (对 FC )， 并 且 对 FS 进行 了 修改 (类 似 于 在 缓冲 图 控制 器 中 提出 的 FS)， 得 
出 它 是 无 活 锁 的 。 


习题 














5.1 节 


5.1 证明 存在 无 活 镇 的 控制 器 ， 每 个 节点 只 利用 一 个 缓冲 区 ， 并 且 允 许 每 个 节点 至 少 向 
其 他 节点 发 送 一 次 包 。 


5.2 节 


5.2 如 果 包 路 由 如 图 5-2 所 示 ， 证 明 dest 不 是 无 死 镇 的 。 

5.3 (下 一 跳 数 模式 ) 给 出 缓冲 图 和 控制 器 万 与 nb 十 数 ， 控 制 器 利用 疆 冲 区 b.[ 站 存储 那些 
距 目 的 节点 的 跳 数 大 于 i 的 包 。 

DHAPUR S? 每 一 个 包 都 需要 保存 跳 数 吗 ? 

5.4 完成 图 BG。( 在 定理 5.13 的 证 明 中 定义 ) 的 确 是 一 个 组 冲力 的 证 明 ， 即 ， 对 于 每 一 条 
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项 目 5.5 ”证 明 存 在 一 个 无 死 锁 的 控制 器 ， 对 于 超 立 方 体 上 的 包 交 换 ， 每 个 节点 只 用 两 个 
缓冲 区 ， 并 且 克 许 包 经 过 最 小 跳 数 路 由 。 
可 否 利 用 区 间 路 由 算法 (4.4.2 小 节 ) 得 到 所 用 过 的 路 径 的 集合 ?利用 线性 区 间 标 号 方法 可 
以 吗 ? 


5.3 节 


5.6 证 明 BC 和 BS 都 是 无 死 锁 的 控制 器 。 
177 5.7 证 明 BC 所 允许 的 每 次 迁移 ，FC 也 允许 。 





第 6 章 波动 算法 与 过 历 算法 


在 设计 各 种 应 用 的 分 布 式 算法 中 ， 进 程 网 络 中 的 几 个 非常 一 般 性 的 问题 经 常 作 为 子 任 务 
出 现 。 这 些 基 本 任务 包括 : 信息 广播 (例如 : 开始 或 者 终止 消息 )、 达 到 进程 间 的 全 局 同步 、 
触发 每 个 进程 中 某 一 事件 的 执行 ， 或 者 计算 一 个 函数 ， 其 中 每 一 进程 拥有 部 分 输入 。 按 照 一 
些 规定 的 、 保 证 所 有 进程 参与 的 拓扑 结构 模式 ， 进 行 消息 传递 来 执行 这 些 任务 。 在 以 后 的 章 
入 里 ,读者 可 以 更 加 清晰 地 看 到 这 些 任务 是 如 此 基本 ,以 至 于 对 更 复杂 的 问题 如 选举 问题 
(第 7 章 )、 终 止 检 测 (第 8 章 ) 问题 或 者 互 斥 问题 的 解决 方法 ， 其 中 进程 乙 间 的 通信 都 经 过 这 
些 消息 传递 模式 完成 。 i 

消息 传递 模式 的 重要 性 ， 从 现在 起 ， 被 称 为 波动 算法 ， 将 它们 从 模式 被 嵌入 到 特定 应 用 
中 的 算法 分 离 出 来 ， 单 独 进行 研究 证 明 是 正确 的 。 本 章 形式 地 定义 了 波动 算法 (6.1.1), 
并 证 明了 关于 它们 的 一 般 结果 (6.1.2 小 节 )。 观 察 可 得 ， 同 一 算法 可 用 于 上 述 所 列 的 所 有 基本 
任务 ， 即 ,广播 、 同 步 和 计算 全 局 国 数 〈6.1.3 小 节 到 6.1.5 小 季 )。6.2 节 提出 了 一 些 广泛 使 用 
的 波动 算法 。6.3 节 讨论 了 遍历 算法 ， 它 是 具有 另外 一 些 性 质 的 波动 算法 ， 算 法 中 计算 的 事件 
具有 因果 全 序 关 系 。6.4 节 给 出 了 分 布 式 深度 优先 搜索 的 几 种 算法 。 

即使 是 波动 算法 经 常用 作 其 他 算法 的 子 程序 ， 本 章 还 是 将 它们 作为 独立 的 问题 处 理 。 原 
因 有 2 个 。 首 先 ， 引 入 概念 使 得 更 多 与 算法 有 关 的 处 理 变 得 容易 ， 因 为 子 程序 的 性 质 已 经 得 到 
人 研究。 其 次 ， 分 布 式 计算 中 的 某 些 问 题 可 通过 一 般 的 构造 方法 解决 ， 当 对 某 个 波动 算法 参数 
化 时 ， 会 产生 特定 算法 。 同 一 种 构造 可 用 于 给 出 不 同 网 络 拓扑 结构 的 算法 ， 或 者 用 于 给 出 关 
于 进程 初始 知识 各 种 假设 的 算法 。 


6.1 波动 算法 的 定义 和 使 用 


除非 特别 阐明 ， 本 章 假设 网 络 的 拓扑 结构 固定 (拓扑 结构 不 发 生变 化 )、 无 向 〈 每 个 信道 
可 在 两 个 方向 传递 消息 ) 和 连通 (任何 两 个 进程 之 间 存在 路 径 )。P 表 示 所 有 进程 的 集合 ，E 表 
示 所 有 信道 的 集合 。 正 如 前 面 章 市 所 述 假设 系统 使 用 异步 消息 传递 且 没 有 全 局 时 钟 或 者 实时 
时 钟 的 概念 。 本 章 算法 也 可 用 于 具有 同步 消息 传递 ( 可 能 要 做 小 的 修改 以 避免 死 锁 ) 的 系统 ， 
或 者 如 果 可 行 ， 还 可 用 于 具有 全 局 时 钟 的 系统 。 然 而 ， 有 些 一 般 性 的 定理 在 这 种 情况 下 ， 不 
成 立 ; 参见 习题 6.1。 


6.1.1 波动 算法 定义 


正如 第 2 章 中 所 见 的 那样 ， 由 于 进程 以 及 通信 子 系统 的 非 确 定性 ， 分 布 式 算法 通常 允许 进 
行 大 量 可 能 计算 。 计 算是 事件 的 集合 ， 是 因果 优先 关系 < 的 偏 序 ， 因 果 优 先 关系 如 同 2.20 中 
的 定义 。ICI 表 示 计 算 C 中 事件 的 数量 ，C, 表 示 进 程 p 中 出 现 事 件 的 子 集 。 假 设 有 一 种 特殊 类 型 
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的 内 部 事件 ， 称 为 判定 事件 。 本 章 的 算法 中 ， 这 样 的 事件 用 语句 decide 简 单 表示 。 波 动 算法 交 
换 有 限 的 信息 ， 然 后 作出 决策 ， 这 在 因果 关系 上 取决 于 进程 中 的 一 些 事件 。 
定义 6.1 波动 算法 是 满足 如 下 三 个 要 求 的 分 布 式 算法 。 
(1) 终止 性 每 个 计算 是 有 限 的 
182 VC :1CI< om 
(2) 判定 性 每 次 计算 至 少 包 括 一 个 判定 事件 : 
VC:3eECie 是 一 个 判定 事件 
(3) 相关 性 每 次 计算 中 ， 存 在 进程 中 的 享 件 ， 该 享 件 在 因果 关系 上 优先 于 判定 享 件 。 
VC:veEC:(e 是 一 个 判定 事件 一 V9gE PISEC, : fe) 


波动 算法 的 一 次 计算 称 为 一 次 波动 。 作 为 另 一 种 表示 ， 在 算法 的 一 次 计算 中 ， 初 始 进程 
(initiator) 也 称 开始 进程 (starter)， 非 初始 进程 (non-initiator)， 也 称 跟随 进程 follower )。 
如 果 进 程 自发 地 开始 执行 局 部 算法 ， 就 称 它 是 初始 进程 ， 即 ， 它 的 执行 是 由 于 进程 内 部 的 基 
些 条 件 触发 所 致 。 只 有 当 算 法 中 的 消息 到 达 并 引发 进程 算法 的 执行 ， 非 初始 进程 才 执 行 算法 。 
初始 进程 中 的 第 一 个 事件 是 内 部 事件 或 者 发 送 事 件 ， 非 初始 进程 中 的 第 一 个 事件 是 接收 事件 。 

由 于 算法 在 诸多 方面 的 不 同 ， 因 而 存在 多 种 波动 算法 。 作 为 处 理 本 章 许 多 算法 的 基本 原 
理 , 以 及 作为 选择 特定 问题 的 算法 的 助手 ， 以 下 给 出 关于 波动 算法 互 不 相同 方面 的 一 列表 。 
也 可 参见 表 6-19。 

(1) 集中 如 果 在 每 次 计算 中 ， 只 有 一 个 初始 进程 ， 则 称 算法 是 集中 式 的 (centralized )。 
如 果 算 法 从 进程 的 任意 子 集 自发 地 开始 执行 ， 则 称 算 靶 是 分 教 式 的 〈decentralized)。 集 中 式 
算法 也 称 为 单 源 (single-source) 算法 ， 分 散 式 算法 称 为 多 源 (multi-source) 算法 。 集 中 式 算 
法 对 波动 算法 的 复杂 度 具 有 重要 影响 。 参 见 表 6-20。 

(2) 拓扑 结构 可 能 为 某 种 特定 的 拓扑 结构 设计 算法 ， 例 如 环 、 树 和 团 等 。 参 见 2.4.1 小 
节 和 B.2 节 。 

(3) 初始 知识 在 进程 中 ,假设 算法 可 以 利用 各 种 初始 知识 ， 参 见 2.4.4 小 节 。 例 子 中 的 
预备 知识 包括 以 下 方面 : 

(a) 进程 标识 每 个 进程 初始 时 知道 自己 的 惟一 名 字 。 

(b) 近邻 标识 每 个 进程 初始 时 知道 它 近邻 的 名 字 。 

183 (c) FHM 参见 B.3 节 。 

(4) 判定 次 数 本 章 所 有 的 波动 算法 中 ， 每 个 进程 至 多 进行 一 次 判定 。 执 行 一 个 判定 事 
件 的 进程 数 可 能 不 同 。 在 某 些 算法 中 ， 只 有 一 个 进程 判定 ， 而 在 另外 一 些 算法 中 ， 所 有 进程 
HAE. HRE 〈6.2.2 小 节 ) 只 在 两 个 进程 中 引起 判定 。 

(5) LRA 本 章 中 所 考虑 的 复杂 度 度 量 是 交换 消息 的 数量 、 交 换 位 的 数目 和 一 次 计算 
所 需 的 时 间 (6.4 节 定义 )。 也 参见 2.4.5 小 节 。 

本 章 的 每 个 波动 算法 中 所 用 的 变量 一 并 给 出 ， 如 有 必要 也 要 给 出 消息 中 所 交换 的 信息 量 。 
在 没有 任何 实际 信息 时 (消息 只 带 有 因果 关系 ， 不 是 信息 )， 大 多 数 算法 发 送 “ 空 消息 ”。 图 
6-9、 图 6-11、 图 6-12 和 图 6-18 所 示 的 算法 利用 消息 携带 非 平凡 信息 。 图 6-15、 图 6-16 和 图 6-17 
所 示 的 算法 利用 不 同 消息 类 型 ， 这 就 要 求 每 一 消息 包括 一 到 二 位 用 以 区 别 不 同类 型 的 消息 。 
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当 使 用 波动 算法 时 ， 消 息 中 可 能 包含 更 多 变量 和 其 他 一 些 信息 。 许 多 应 用 依靠 几 种 波动 
同时 或 者 顺序 传播 。 在 这 种 情况 下 ， 消 息 所 属 的 那个 波动 信息 必须 包含 在 消息 中 。 进 程 还 可 
以 保存 另外 的 变量 来 管理 波动 ， 或 者 管理 当前 处 于 活动 状态 的 那些 波动 。 

波动 算法 的 一 个 重要 子 类 是 由 集中 式 波动 算法 构成 的 。 具 有 下 述 的 另外 两 个 性 质 : 初始 
进程 是 判定 的 惟一 进程 ; 所 有 事件 是 完全 因果 关系 有 序 的 。 具 有 这 些 性 质 的 波动 算法 称 为 遍 
历 算 法 (traversal algorithm )。6.3 节 中 讨论 。 


6.1.2 波动 算法 的 一 些 基 本 结果 


本 节 所 给 出 的 引 理 已 被 证 明 ， 这 些 引 理 可 以 使 人 们 更 深刻 理解 波动 计算 的 结构 。 提 出 了 
波动 算法 消息 复杂 度 的 两 个 平凡 下 界 。 

1. 波动 的 结构 性 质 

首先 ， 对 于 计算 中 的 每 一 事件 ， 初 始 进程 中 的 事件 先 于 该 事件 。 

引 理 6.2 对 于 每 一 事件 e 会 C， 看 在 初始 进程 p 和 Cr 中 的 事件 F， 满 足 F < e。 

证 明 。 为 /选择 一 个 e 的 历史 中 的 最 小 元 素 ， 即 ，f <e 且 不 存在 事件 f' <f。 由 于 每 个 事件 的 
历史 是 有 限 的 ， 因 此 这 样 的 事件 f 存 在 。 仍 然 要 证 明 ， 在 /发 生 的 地 方 ， 进 程 p 是 初始 进程 。 首 
先 ， 注意 是 进程 p 中 的 第 一 个 事件 ， 否 则 就 会 有 p 中 较 早 的 事件 领先 于 f。 非 初始 进程 的 第 一 个 
事件 是 接收 事件 ， 会 有 一 对 应 的 发 送 事 件 先 于 该 接收 事件 。 这 与 的 最 小 性 了 矛盾。 因此，p 是 
一 初始 进程 。 口 

一 个 有 初始 进程 的 波动 定义 了 网 络 的 一 棵 生成 树 。 对 于 每 一 个 非 初 始 进程 ， 选 择 信道 ， 
通过 该 信道 接收 第 一 条 消息 。 

引 理 6.3 。 设 C 是 具有 一 个 初始 进程 p 的 波动 ， 且 对 于 每 一 非 初始 进程 9， 设 fathers 是 q 的 近 
领 ， 从 该 近邻 ，g 可 以 在 其 第 一 个 事件 中 接收 消息 。 那 么 图 了 = (P, Er), 且 E; = {gr: gq*p 信 
r = Jotjper} 是 一 棵 方向 朝 p 的 生成 树 。 

证 明 。 由 于 7 中 的 节点 数 比 边 数 多 一 个 ， 足 以 证 明 T 不 包含 回路 。 这 是 因为 ， 对 于 g 中 的 第 
一 个 事件 ec, ，gr CE BeBe, < ev， 且 < 是 偏 序 。 口 

定义 6.1 中 第 三 个 子 旬 中 的 事件 /可 以 选择 为 所 有 9 的 发 送 事 件 ， 除 了 判定 事件 发 生 的 那个 
进程 之 外 。 

引 理 6.4 设 C 是 一 次 波动 ，d,E C 是 进程 p 中 的 一 个 判定 事件 。 那 么 


Ver*p:3rec: (f Xd, A f 是 一 个 发 送 事件 ) 


证 明 。 由 于 C 是 一 次 波动 ， 存 在 事件 FE Cs， 在 因果 关系 上 先 于 d,。 选 择 / 为 Cs 中 先 于 d, 的 
最 后 事件 。 为 证 明 f 是 一 发 送 事 件 ， 观 察 因果 关系 定义 (定义 2.20)， 它 的 定义 荔 含 着 存在 序列 
(因果 链 ) 


f= e, Cls ees e&=d,, 


满足 对 于 每 一 个 i < k, efle REER AR ERRERA E R -E 
对 。 由 于 /为 9 中 先 于 d 的 最 后 一 个 事件 。e 出 现在 与 进程 4 不 同 的 一 个 进程 中 ， 因 此 /是 一 发 送 
事件 。 口 

2. 波动 复杂 度 的 下 界 

由 引 理 6.4 立 即 可 得 ， 在 一 次 波动 中 所 交换 的 消息 数 的 下 界 为 N-1。 如 果 判 定 事件 出 现在 
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波动 的 惟一 初始 进程 中 (在 遍历 算法 中 疙 是 这 种 情况 )， 这 时 下 界 为 N 条 消息 。 任 意 网 络 的 波 
动 算法 至 少 利 用 IEI 条 消息 。 

定理 6.5 设 C 是 只 有 一 个 初始 进程 p 的 一 次 波 动 ， 满 足 判 定 事件 d, 出 现在 Dp 中。 那么 ，C 中 
至 少 交换 NN 条 消息 。 

证 明 。 由 引 理 6.2， 对 于 C 中 的 每 个 事件 ，p 中 存在 事件 优先 于 它 。 利 用 因果 关系 序列 ， 如 ， 
在 引 理 6.4 证 明 中 的 序列 ， 容 易 证 明 p 中 至 少 出 现 一 个 发 送 事件 。 由 引 理 6.4， 发 送 事 件 也 出 现 
在 其 他 各 进程 中 。 这 使 得 发 送 事件 的 总 数 为 N。 口 

定理 6.6 ” 设 A 是 任意 网 络 的 波动 算法 ， 没 有 近邻 标识 的 初始 知识 。 那 么 ， 每 次 计算 中 ，A 
至 少 交 撞 |E| 条 消息 。 

证 明 。 假 设 4 有 一 个 计算 C。 其 中 交换 消息 数 少 于 IE1。 存 在 信道 xy， 它 不 携带 C 中 的 消息 。 
如 图 6-1 所 示 。 考 虑 在 信道 x 和 y 之 间 插 入 第 点 z 所 得 的 网 络 G'， 由 于 节点 没有 近邻 标识 知识 ，G 
中 x 和 y 的 初始 状态 如 同 在 G 中 的 初始 状态 。 对 于 G 中 的 所 有 其 他 节点 同样 成 立 。 因 此 ，C 中 所 
有 的 事件 ， 从 G' 的 初始 配置 开始 ， 以 同样 的 次 序 ， 都 是 可 应 用 的 。 但 是 现在 ， 存 在 z 中 的 一 个 
事件 不 先 于 判定 事件 发 生 。 口 

在 第 7 章 中 ,证 明了 无 近邻 知识 的 环 网 和 任意 网 上 ， 分 散 式 波动 算法 消息 复杂 度 的 一 个 更 
好 下 界 。 参 见 推论 7.14 和 7.16。 


6.1.3 具有 反馈 的 信息 传播 


本 小 节 表 明 ， 当 某 些 信息 必须 被 广 
播 到 所 有 进程 中 ， 且 完成 广播 后 ， 某 些 G G’ 
进程 必须 接收 通知 消息 ， 波 动 算法 就 是 图 6-1 未 用 信道 中 插入 进程 
所 需 的 算法 。 以 下 问题 [Seg83] 阐 述 了 县 
有 反馈 信息 传播 【propagation of information with feedback, PIF) 的 要 求 。 进程 子 集 由 那些 
具有 消息 M 的 那些 进程 组 成 (所 有 进程 具有 相同 消息 )， 且 这 些 消息 必须 被 广播 ， 所 有 进程 都 
接收 并 接受 消息 M。 某 些 进程 必须 得 到 广播 终止 的 通知 ， 即 ， 它们 必须 执行 特殊 的 通知 事件 。 
要 求 当 所 有 进程 已 经 收 到 消息 M， 才 能 执行 通知 事件 。 算 法 必须 利用 有 限 个 消息 。 

PIF 算 法 的 通知 被 认为 是 一 个 判定 事件 。 

定理 6.7 每 个 PIF 算 法 是 一 个 波动 算法 。 

证 明 。 设 P 是 PIF 算 法 。 要求 P 中 的 每 个 计算 是 有 限 的 。 在 每 次 计算 中 ， 出 现 一 个 通知 事件 
(判定 )。 如 果 在 P 的 某 些 计算 中 ， 通 知 d 出 现在 进程 的 任 一 事件 之 前 ， 那么 由 定理 2.21 和 事实 
2.23， 存 在 有 的 一 次 执行 ， 其 中 通知 事件 出 现在 4 已 经 接受 任何 消息 之 前 ， 这 与 要 求 发 生 矛 盾 . 口 

这 里 必须 记 住 定理 2.21 仅 对 异步 消息 传递 的 系统 成 立 。 参 见习 题 6.1， 

定理 6.8 每 个 波动 算法 可 用 作 一 个 PIF 算 法 。 

证 明 。 设 4 是 波动 算法 。 为 把 4 作为 PIF 算 法 使 用 ， 初始 时 知道 M 的 进程 是 4 的 初始 进程 。 
信息 M 被 追加 在 4 的 每 条 消息 后 面 。 这 是 可 能 的 ， 因 为 通过 构造 ， 4 的 初始 进程 开始 时 知道 M， 
接收 进程 在 接 到 消息 之 前 ， 并 不 发 送 消息 。 因此 接收 进程 也 会 知道 M。 波 动 中 的 判定 事件 在 
每 个 进程 中 的 一 个 事件 之 后 发 生 。 当 前 者 出 现时 ， 每 个 进程 知道 W， 它 被 认为 是 PIF 算 靶 所 要 
求 的 通知 。 口 
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构造 的 PIF 算 法 与 算法 4 具有 相同 的 消息 复杂 度 。 并 且 共 享 6.1.1 节 所 提 到 的 4 的 所 有 其 他 性 
质 ， 除 了 位 复杂 度 。 可 以 只 将 M 附 加 到 通过 每 个 信道 发 送 的 第 一 条 消息 中 ， 来 减少 位 复杂 度 。 
如 果 w 是 W 的 位 数 ， 则 所 得 算法 的 位 复杂 度 超过 4 的 位 复杂 度 一 个 因子 w > {El。 


6.1.4 同步 


本 小 节 表 明 ， 当 要 在 进程 间 达 到 全 局 同步 时 ， 波 动 算法 就 是 所 需 的 算法 。 下 述 问题 
fFin79] 曾 明了 同步 (Synchronization，SYN) 的 要 求 。 在 每 个 进程 中 ， 必 须 执行 事件 a,; 在 
某 些 进程 中 ， 必 须 执行 事件 bp,， 满 足 所 有 a 事件 的 执行 必须 暂时 地 发 生 在 所 有 bs 事件 被 执行 之 
前 。 算 法 必须 利用 有 限 个 消息 。 

在 SYN 算 法 中 ， 将 事件 b, 看 作 淹 定 事件 。 

定理 6.9 每 一 个 SYN 算 法 是 一 个 波动 算法 。 

证 明 。 设 3 是 SYN 算 法 。 要 求 $ 中 的 每 次 计算 是 有 限 的 ， 且 在 每 次 计算 中 事件 总 (判定 ) 
出 现 。 如 果 在 5 的 某 些 计算 中 ， 出 现 事 件 b,，a, 不 是 因果 关系 上 优先 于 事件 5,， 那 么 ， 由 定理 
2.21 和 事实 2.23 可 得 ， 存 在 S 的 一 次 执行 ， 在 这 次 执行 中 ，b, 在 gy 之 前 出 现 。 口 

定理 6.10 每 个 波动 算法 可 用 作 一 个 SYN 算 法 。 ha 

证 明 。 设 4 是 波动 算法 。 为 把 4 用 作 SYN 算 法 ， 要 求 每 个 进程 4 在 发 送 4 的 任何 消息 之 前 或 
者 判定 之 前 执行 a4。 事 件 b, 发 生 在 进程 p 中 判定 事件 之 后 。 由 引 理 6.4， 对 于 每 个 g，a, 在 因果 
关系 上 出 现在 各 判定 事件 之 前 。 口 

构造 的 SYN 算 法 与 4 具有 相同 的 消息 复杂 度 ， 并 且 共 享 在 6.1.1 节 谈 到 的 4 的 其 他 所 有 性 
质 。 


6.1.5 计算 下 确 界 函数 


本 节 的 波动 算法 就 是 这 样 一 种 算法 ， 计 算 一 个 函数 ， 它 的 值 主要 依靠 每 个 进程 的 输入 。 
作为 这 种 函数 的 一 个 代表 ， 我 们 考虑 这 样 一 种 算法 ， 由 偏 序 集 计算 所 有 输入 的 下 确 界 。 

WR (X, <) 是 偏 序 ， 那 么 c 称 为 z 和 b 的 下 确 界 (infimum)， 如果 c <a, c<b, HYd: 
(d<aNd<b=d<c). 假设 Xx 具有 性 质 ， 即 它 的 下 确 界 总 是 存在 ;在 这 种 情况 下 ， 下 确 界 是 
惟一 的 。 用 a 人 4b 表示 。 现 在 人 是 一 个 二 元 运算 符 ， 因 为 它 是 可 交换 ( 即 ，a 人 b = bp 人 a) 和 可 
结合 的 ( 即 ，a 人 (bc)= (a 人 5b) Ac), 操作 可 以 推广 到 有 限 集 上 : 

inf ji, oes feb = fyb Aji 

PRA (INF) 计算 可 以 阐述 为 以 下 问题 。 每 个 进程 q 具 有 输入 加， 它 是 偏 序 集合 xX 上 的 一 
个 元 素 。 要 求 某 些 进程 计算 下 确 界 的 值 inf{): qE P}, 并 且 这 些 进 程 知道 计算 什么 时 候 终止 。 
它们 将 计算 的 结果 写 入 变量 out 中 ， 以 后 不 允许 改变 这 个 变量 。 

写 事件 赋值 为 ont， 被 认为 是 INF 中 的 一 个 判定 事件 。 

定理 6.11 每 一 个 INF 算 法 是 一 个 波动 算法 。 

证 明 。 设 /是 INE 算 法。 假设 存在 /中 的 计算 C， 具 有 初始 配置 y， 在 计算 中 ， Pp 将 值 / 写 入 
ouis，g 中 任 一 事件 都 不 在 该 写 事件 之 前 发 生 。 考 虑 初始 配置 y'， 在 这 个 配置 中 ， 除 了 事件 g 选 
FET ARRAS HAERE 交 j' 之 外 ， 配 置 y' 与 y 相 等。 因为 没有 一 个 使 用 q 的 输入 的 事件 在 
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因果 关系 上 先 于 C 中 p 的 写 事件 ， 在 这 个 写 事件 之 前 的 C 中 所 有 事件 可 被 以 从 Y' 开 始 的 相同 次 序 
应 用 。 因 此 ， 在 最 终 计 算 中 ， 如 同 在 C 中 一 样 ，p 写 入 错误 的 结果 J。 口 
定理 6.12 每 个 波动 算法 可 用 来 计算 一 个 下 确 界 。 

证 明 。 设 给 定 的 波动 算法 4。 每 个 进程 4 另 设 一 个 变量 vas， 初始 化 为 j,。。 在 一 次 波动 中 ,该 
变量 赋值 如 下 。 无 论 什么 时 候 ， 进 程 4 发 送 4 的 一 条 消息 ，w 的 当前 值 就 包括 在 这 条 消息 中 ， 
无 论 什么 时 候 ， 进 程 g 接 到 4 的 一 条 消息 ， 消 息 中 包括 值 *， 就 将 wm 的 值 设 为 w 人 v。 当 判定 事件 
在 p 中 执行 时 ，v, 的 当前 值 就 写 入 oui,。 | 

必须 证 明 写 入 了 正确 值 。 称 正确 解 为 / = inf EP}. MPR HR, Avo 
示 执 行 4 后 ve 的 值 。 因 为 vs 被 初始 化 为 jis， 在 波动 过 程 中 它 的 值 只 碱 小 。 对 于 gq 中 的 每 个 事件 a， 
VO & jj 成立。 对 v 的 赋值 蕴含 着 ， 对 于 事件 4 和 b，a <b =v av, fA A PVR tA 
为 两 个 已 存在 值 的 下 确 界 ， 对 于 波动 过 程 中 的 所 有 值 ，J < v 成 立 。 因 此 ， 如 果 d 是 p 中 的 判定 
事件 ， 那 么 值 vw 满足 J< v”， 并 且 每 个 进程 g 中 至 少 有 一 个 事件 在 d 之 前 发 生 ， 对 于 所 有 4g，v 信 
Sje SHEA, Ja Vv, 

所 构造 的 INF 算 法 共享 了 4 的 所 有 性 质 ， 除 了 位 复杂 度 。 因 为 X 中 的 元 素 被 附加 到 4 的 每 条 
消息 后 面 。 下 确 界 函 数 的 者 款 看 起 来 非常 抽象 ， 但 是 事实 上 许多 函数 可 表示 为 下 确 界 ， 参 见 
[Tel91b, Theorem4.1.1.2]。 

事实 6.13 (下 确 界定 理 ) 如果 太 是 集合 X 上 的 二 元 算 子 ， 满 足 

(1) KART RHR, Bpakb = b 太 a， 

(2) KATHA, BP (axb) kc=ak (bxc), L 

(3) KAFF, Prakaz=a 

MLA, BEXLHRES, BAKE PRRBR, 

MEA=VMEMNSAAA: BRAM. SHH. waa MAREAK, RAAT. 
最 小 公 倍 数 和 集合 的 交 或 并 。 

推论 6.14 进程 的 局 部 运算 符 和 信 ，V ，min，max，gcd，lcm， 介 和 U 的 值 可 在 一 次 波动 中 
计算 出 。 

具有 可 结合 的 和 可 交换 的 但 不 是 矫 等 的 运算 符 的 计算 在 6.5.2 节 中 讨论 。 


6.2 波动 算法 集 
以 下 三 节 讨论 波动 算法 和 遍历 算法 的 集 。 给 出 的 所 有 算法 都 是 指 进程 p 的 算法 。 
6.2.1 环 网 算法 

















本 小 节 给 出 环 网 上 的 波动 算法 。 同 样 的 算法 可 用 于 哈密 尔 顿 (Hamiltonian ) 网 络 ， 其 中 ， 
一 个 确定 的 哈密 尔 顿 回 路 被 编码 到 进程 中 。 假 设 对 于 每 个 进程 p， 给 定 它 的 一 个 专门 的 近邻 
Nexm， 满 足以 这 种 方式 选择 的 所 有 信道 形成 一 个 哈密 尔 顿 回路 。 

算法 是 集中 式 的 。 初 始 进程 沿 着 回路 发 送 消 息 <tok> ( 称 为 令 牌 )， 每 个 进程 传递 消息 ， 
当 消 息 回 到 初始 进程 ， 初 始 进程 进行 判定 。 参 见 图 6-2 所 示 的 算法 。 

定理 6.15 环 网 算法 (图 6-2 所 示 的 算法 ) 是 波动 算法 。 

证 明 。 称 初始 进程 为 pp。 因 为 每 个 进程 至 多 发 送 一 条 消息 ， 算 法 总 共 至 多 交换 N 条 消息 。 

在 有 限 步 内 ,算法 达到 终止 配置 。 在 这 个 配置 中 ，po 已 经 发 送 了 令 牌 ， 即 ， 在 它 的 程序 中 
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已 经 传递 了 发 送 语句 。 信 道中 没有 <tok> 消 息 的 在 传输 中 ， 否 则 消息 会 被 接收 ， 而 且 配 置 也 不 
是 终止 。 也 设 有 除了 Po 之 外 的 进程 “ 持 有 ” 令 牌 ( 即 ， 已 经 收 到 令 牌 ， 但 没有 发 送 <tok> )， 
否则 这 个 进程 就 会 发 送 <tok> 消 息 ， 配 置 也 不 是 终止 的 。 总之，(1) po 已 经 发 送 了 令 牌 ，(2) 
对 于 每 个 发 送 了 令 牌 的 p>，Nexts 已 经 收 到 这 个 令 牌 ,，(3) 对 于 每 个 收 到 该 令 牌 的 进程 p#po，P 
已 经 发 送 了 令 牌 。 由 此 以 及 Next 的 性 质 可 得 ， 每 个 进程 已 经 发 送 和 接收 令 牌 。 由 于 po 已 经 收 到 
令 牌 ,配置 是 终止 的 ，po 执 行 了 判定 语句 。 

每 个 ppo 的 进程 对 于 令 牌 <tok> 的 接收 和 发 送 ， 在 po 的 接收 之 前 ， 因 此 满足 相关 性 条 件 。 
口 






















For the initiator: 
begin send (tok) to Nezt, ; receive (tok) ; decide end 










For non-initiators: 
begin receive (tok) ; send (tok) to Neztp end 





图 6-2 环 网 算法 


6.2.2 树 算法 


本 小 节 给 出 树 网 上 的 波动 算法 。 如 果 网 络 的 生成 树 是 可 用 的 相同 的 算法 可 被 用 于 任意 网 
络 。 假 设 从 树 的 叶 节点 开始 执行 算法 。 算 法 中 ， 每 个 进程 只 发 送 一 条 消息 。 如 果 进 程 经 过 依 
附 它 的 每 一 个 信道 接收 一 条 消息 ， 除 了 一 种 情况 (初始 时 ， 这 个 条 件 对 叶 节点 成 立 )， 则 进程 
经 过 其 余 信道 发 送 消息 。 如 果 进 程 经 过 所 有 依附 的 信道 接收 消息 ， 则 它 进行 判定 。 参 见 图 6-3 
所 示 的 算法 。 


var rec,(g] for each q € Neigh, : boolean init false ; 
(* recp[q] is true if p has received a message from q *) 


begin while #{q : recy(q] is false} > 1 do 
begin receive (tok) from q ; recplg] := true end ; 
(* Now there is one go with recp|qo] is false *) 


send (tok) to go with recp[qoj is false ; 
z: receive (tok) from go ; recp[go] := true ; 
decide 
(* Inform other processes of decision: . 
a forall q € Neigh,,q # qo do send (tok) to q *) 
en 





图 6-3 树 网 算法 
为 证 明 此 算法 是 波动 算法 ， 引 入 几 种 表示 法 。 设 /是 p 向 4 发 送 消息 的 事件 ， 设 8 ,是 4 接收 
2 的 消息 的 事件 。7z 是 从 p 不 经 过 边 p4 可 达 的 进程 子 集 (在 这 条 边 上 p 这 边 的 进程 )。 网 络 的 连 
通 性 纺 含 (参见 图 6-4) 


Tu= U T, UP gop = DWU U T 


reNeighyrigy reneigh, ” 


图 6-3 所 示 的 算法 中 注释 符 内 的 forall 语 句 将 在 本 小 节 最 后 讨论 。 下 面 定理 是 有 关 图 6-3 所 
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示 的 算法 的 ， 但 除了 这 条 语句 。 

定理 6.16 树 网 算法 (图 6-3 所 示 的 算法 ) 是 波动 算法 。 

证 明 。 因 为 每 个 进程 至 多 发 送 一 条 消息 ， 算 法 中 共 利 用 至 多 N 条 消息 。 这 蕴含 着 ， 在 有 限 
步 后 ， 算 法 到 达 终止 配置 y。 要 证 明 在 配置 y 中 ， 至 少 有 一 个 进程 执行 了 判定 事件 。 

设 F 是 Y 中 rec 位 值 为 假 的 个 数 ，K 是 y 中 已 经 发 送 了 消息 的 进程 数 。 因 为 在 Y 中 ， 没 有 消息 在 
传输 中 (否则 } 将 不 会 终止 )， 因 而 F= (2N-2) -K; rec 位 的 总 数 为 2N-2， 其 中 的 K 个 为 真 。 

假设 y 中 不 存在 进程 已 经 进行 判定 ，y 中 还 没有 发 送 消 息 的 N-K 个 进程 中 ， 每 个 至 少 有 两 
个 假 的 rec 位 ; 否则 它们 能 够 发 送 消息 ， 这 与 y 是 终止 的 相 予 盾 。 在 y 中 已 经 发 送 一 条 消息 的 K 
个 进程 中 ， 每 个 进程 至 少 有 一 个 假 的 rec 位 ; 否则 它们 就 会 判定 ， 这 与 ?是 终止 的 相 矛 盾 。 因 此 
F>2(N-K)+K, H(2N-2) -K> XN-K) + 大， 这 表明 ，-2>0。 了 矛盾 。 因 此 中 至 少 发 生 一 次 
判定 。 参 见习 题 6.5。 

最 后 ， 要 证 明 每 个 进程 中 存在 一 个 事件 在 判定 事件 之 前 发 生 。 设 fs 是 p 向 q 发 送 消息 的 事 
件 ， 设 gp 是 9 接收 p 的 消息 的 事件 。 对 接收 事件 用 归纳 法 证 明 


Vs E Ty Je E Cs: eXg,, 


假设 上 式 对 于 gj 之 前 的 所 有 接收 事件 为 真 ， 现 在 f,, 先 于 g,。( 进程 p 中 )， Pp 的 程序 蕴含 对 于 
所 有 r © Neighs 且 r #9q，8gw 先 于 fs。 由 归纳 假设 可 得 ， 对 于 所 有 这 样 的 7， 以 及 所 有 s E Tip, FF 
在 事件 e EC, He < 8,,， 因 此 e < guyo 

对 于 所 有 r E Neigh,, 2, 在 进程 p 中 的 判定 事件 d, 之 前 ， XS BVs © Pde EC,: e Xd,。 

J 

读者 可 以 在 一 棵 较 小 的 树 上 模拟 算法 的 一 次 计算 (例如 ， 图 6-4 所 示 的 子 树 )， 充 分 理解 
下 列 所 讨论 的 事实 。 在 图 6-3 所 示 的 算法 中 ， 有 两 个 进程 经 过 它们 的 信道 接收 消息 ， 并 进行 判 
定 ; 其 他 所 有 进程 仍 在 等 待 消息 ， 它 们 的 程序 计数 器 指向 终止 配置 中 的 x。 如 果 将 forall 语 句 
(图 6-3 所 示 算 法 的 注释 中 ) 加 入 程序 ， 所 有 进程 都 判定 ， 在 终止 配置 中 ， 每 个 进程 处 于 终止 
状态 。 修 改 后 的 程序 总 共 利用 2N-2 条 消息 。 


Tq 和 Tap 
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6.2.3 回 波 算法 


回 波 算法 是 一 种 集中 式 的 波动 算法 ， 适 用 于 任何 网 络 的 拓扑 结构 。Chang[fCha82] 首 先 独 
立 提 出 了 这 个 算法 。 因 此 有 时 称 该 算法 为 Chang 的 回 波 算法 。Segall[Seg83] 提 出 了 一 个 稍微 更 
有 效 的 算法 ， 本 节 给 出 这 个 算法 。 

算法 将 消息 <tok> 扩 散 到 所 有 进程 中 ， 定 义 了 一 棵 如 同 引 理 6.3 中 定义 的 生成 树 。 令 牌 沿 
着 这 棵 树 边 上 的 “回声 ”返回 ， 就 像 树 网 算法 中 的 消息 流 。 图 6-5 所 示 的 算法 中 给 出 这 个 算法 。 
初始 进程 向 所 有 它 的 近邻 发 送 消 息 。 一 旦 接 到 第 一 条 消息 ， 非 初始 进程 就 把 消息 转发 给 它 的 
所 有 近邻 ,除了 它 收 到 消息 的 那个 近邻 。 当 非 初始 进程 收 到 来 自 于 所 有 近邻 的 消息 时 ， 就 像 
它 的 父 节 点 发 送 回 波 。 当 初始 进程 收 到 所 有 近邻 的 消息 时 ， 就 进行 判定 。 


var recp : integer init 0 ; (* Counts number of received messages *) 
father, : P init udef, 

















For the initiator: 
begin forall g € Neigh, do send (tok) to q; 
while rec, < #Neigh, do 
begin receive (tok) i recp := rec, + 1 end ; 








decide 





end 










For non-initiators: 
begin receive (tok) from neighbor q ; father, := q ; recp := Tecp +1; 
forall q € Neigh,, q # father, do send (tok) toq ; 
while rec, < #Neigh, do 
begin receive (tok) ; recy := recy + 1 end ; 
send (tok) to father, 













end 


图 6-5 回 波 算法 


定理 6.17 回 波 算法 (图 6-5 所 示 的 算法 ) 是 波动 算法 。 

证 明 。 每 个 进程 经 过 所 依附 的 每 条 信道 ， 至 多 只 能 发 送 一 条 消息 ， 每 次 计算 中 所 交换 的 
消息 数 是 有 限 的 。 设 ?是 初始 进程 为 mo 的 一 次 计算 C 中 所 达到 的 终止 配置 。 

对 于 这 个 配置 ， 定 义 〈 类 似 于 定理 6.3 中 的 定义 ) 图 T= (P, Er), pq EEr © father, = q. 
为 证 明 此 图 是 一 棵 树 ， 必 须 证 明 ， 图 中 的 边 数 比 节点 数 少 1 ( 引 理 6.3 声 明 ，7 是 一 棵 树 ， 但 候 
设 算法 是 波动 算法 ， 这 仍 是 我 们 这 里 要 证 明 的 )。 观 察 可 见 ，C 中 的 每 一 进程 发 送 消息 到 所 有 
它 的 近邻 由， 除了 (如果 进 程 不 是 初始 进程 ) 它 接收 第 一 条 消息 的 近邻 。 这 蕴含 着 ， 每 一 个 
它 的 近邻 至 少 接收 C 中 的 一 条 消息 。 并 且 加 入 到 C 中 。 由 此 可 得 ， 对 于 所 有 p + po 的 进程 ， 
Sather, + udef。7T 不 含 回路 的 证 明 如 间 引 理 6.3 中 的 证 明 。 

树 根 朝向 me。 用 7 表示 p 的 子 树 中 的 节点 集合 。 网 络 中 不 属于 7 的 边 为 非 树 边 。 在 配置 y 中 ， 
每 个 进程 p 至 少 会 向 它 的 所 有 近邻 发 送 消息 ,除了 它 的 父 节 点 father,， 因 此 ， 在 C 中 每 条 非 树 
边 都 可 以 在 两 个 方向 携带 消息 。 设 是 p 向 其 父 节点 发 送 消息 的 事件 (如 果 它 出 现在 C 中 )， 8p 
十 p 的 父 节点 接收 来 自 p 中 消息 的 事件 (如 果 它 出 现 )。 对 这 棵 树 中 节点 用 归纳 法 ， 可 以 证 明 

(1) 对 于 每 个 p + po 的 进程 ，C 中 包含 事件 /, 。 





116 PHD EAH 法 


(2) 对 于 所 有 s E 7,， 存 在 事件 e E C,， 满 足 e Xz, 

我 们 考虑 以 下 两 种 情况 。 

p 是 叶 节 点 。p 在 C 中 已 经 接收 来 自 父 节点 的 消息 ， 以 及 所 有 其 他 近邻 的 消息 (因为 所 有 其 
他 信道 都 是 非 树 边 }。 因 此 将 令 牌 <tok> 发 送 给 p 的 父 节点 是 可 应 用 的 ， Mkb, COUAR 
HT, Aap, BIR. D28 

p 不 是 叶 节 点 。 在 C 中 ，p 已 经 收 到 来 自 父 节点 的 消息 ， 并 且 经 过 所 有 非 树 边 接 收 消息 。 由 
归纳 假设 ， 对 于 p 的 每 个 子 节点 p'，C 包 含 j'。 由 于 y 是 终止 的 ，C 也 包含 8,'"。 因 此 ， 令 牌 <tok> 
向 p 的 父 节点 的 发 送 是 可 应 用 的 ， 当 y 终 止 时 ， 它 已 经 发 生 。7T, 是 由 T,'、p 的 子 节点 及 p 自 身 的 
并 集 组 成 的 集合 。 由 归纳 假设 可 以 证 明 ， 对 于 这 个 集合 中 的 每 一 进程 ， 存 在 先 于 8, 的 事件 。 

由 此 可 得 ，po 已 经 接收 来 自 于 每 个 近邻 的 一 条 消息 ，Po 已 经 执行 了 一 次 判定 事件 ， 每 个 进 
程 中 有 一 事件 在 这 个 判定 事件 之 前 。 m 

图 6-5 所 示 的 算法 中 的 一 次 计算 所 构造 的 生成 树 有 了 时 用 在 随后 执行 的 算法 中 。( 例 如 ， 计 
算 最 短路 径路 由 表 的 Merlin-Segall 算 法 ， 假 设 初始 时 给 出 了 根 为 w 的 生成 树 ; 参见 4.2.3 小 节 。 
可 以 利用 回 波 算法 计算 初始 的 生成 树 。 ) 在 算法 的 最 终 配 置 中 ， 每 个 进程 〈 除 了 进程 mm) 已 经 
记录 了 树 中 哪 一 个 近邻 是 它 的 父 节点 ， 但 是 没有 记录 哪个 近邻 是 它 的 子 节点 。 在 算法 中 ， 经 
过 非 树 边 接收 来 自 父 节点 的 相同 消息 ， 并 接收 来 自 子 节点 的 相同 消息 。 如 果 要 了 解 树 中 子 节 
点 的 知识 ， 就 要 稍微 修改 算法 ， 以 便 能 向 父 节 点 发 送 不 同 的 消息 〈 非 初始 进程 进行 的 最 后 发 
送 操作 )。 进 程 的 子 节 点 就 是 那些 近邻 节点 ， 从 这 些 近 邻接 收 不 同 的 消息 。 


6.2.4 轮 询 算法 





在 图 网 中 ， 每 一 对 进程 之 间 存 在 信道 。 如 果 进 程 已 经 接收 了 每 一 近邻 的 消息 ， 就 进行 判 
定 。 在 图 6-6 所 示 的 轮 询 算法 中 ， 初 始 进程 要 求 每 个 近邻 用 一 条 消息 进行 应 答 ， 并 在 收 到 所 有 
消息 后 进行 判定 。 

定理 6.18 Him (图 6-6 所 示 的 算法 ) 是 波动 算法 。 

证 明 。 经 依附 于 初始 进程 的 每 条 信道 ， 算 法 发 送 两 条 消息 。 初 始 进程 的 每 个 近邻 对 于 原 
始 轮 询 只 应 答 一 次 。 因 此 ， 初 始 进程 接 到 N-1 个 应 答 。 这 就 是 判定 所 需 的 准确 数目 ， 这 蕴含 
着 初始 进程 将 做 判定 ， 且 每 一 进程 中 有 一 个 事件 在 该 判定 事件 之 前 。 o 

轮 询 算法 可 用 于 星 型 网 络 ， 在 这 种 网 络 中 ， 中 心 就 是 初始 进程 。 





var recy : integer init 0; (* for initiator only *) 





For the initiator: 
begin forall q € Neigh, do send (tok) to qf ; 
while rec, < #Neigh, do 
begin receive (tok) ; rec, := recp + 1 end ; 







decide 





end 











For non-initiators: 
begin receive (tok) from q ; send (tok) to q end 





图 6-6 轮 询 算法 
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6.2.5 相位 算法 


本 节 所 给 出 的 相位 算法 ， 是 一 种 分 散 式 的 算法 ， 适 合 于 任意 网 络 的 拓扑 结构 。 算 法 在 文 
献 [Tel91b，4.2.3 节 ] 中 论述 。 这 个 算法 可 用 作 有 向 网 的 波动 算法 。 

算法 要 求 进程 知道 网 络 直 径 ， 并 在 算法 中 将 它 作 为 常量 D。 如果 进 程 利 用 大 于 网 络 直 径 的 
常量 D'， 算 法 仍然 正确 (尽管 效率 不 是 很 高 )。 因 此 ， 为 了 应 用 这 一 算法 ， 不 需要 精确 地 知道 
网 络 直径 。 如 果 已 知 网 络 直径 的 上 界 (例如 ，N-1) 就 是 够 了 。 所 有 进程 必须 利用 同一 个 下 
径 D'。Peleg[Pel90] 扩 充 了 算法 ， 使 得 在 执行 中 可 以 计算 出 网 络 直 径 。 但 是 这 种 扩充 要 求 有 
可 用 的 惟一 标识 。 

1. 一 般 情 况 

算法 可 用 于 任意 的 有 向 网 中 ， 信 道 只 能 在 一 个 方向 传递 信息 。 在 这 种 情况 下 ， 节 点 p 的 近 
邻 有 入 近邻 〈in-neighbor， 进 程 只 能 向 p 发 送 消息 ) 和 出 近邻 (out-neighbor，p 只 能 向 进程 发 
送 消 息 )。p 的 入 近邻 存储 在 集 1n, 中 ，p 的 出 近邻 存储 在 集 Outs 中 。 

在 相位 算法 中 ， 每 个 进程 向 每 个 出 近邻 只 发 送 D 条 消息 。 仅 当 收 到 来 自 每 个 人 近邻 的 ;条 
消息 后 ， 才 将 第 (i+1) 条 消息 发 送 给 每 个 出 近邻 ， 参 见 图 6-7 所 示 的 算法 。 

的 确 ， 由 算法 可 见 ， 通 过 每 条 信道 至 多 发 送 D 条 消息 (以 下 证 明 通 过 每 条 信道 至 少 发 送 D 
条 消息 )。 如 果 边 pg 存在 ， 设 /是 p 向 4 发 送 消息 的 第 ;个 事件 ， 89% 是 4 接收 p 的 消息 的 第 ;个 事 
件 。 如 果 p 和 9 之 间 的 信道 满足 fifo 假 设 ， 这 些 事 件 通信 ， 并 且 有 ?< gw 自然 满足 。 如 果 信 道 
不 具有 fifo 性 质 ， .加 和 gw 之 间 的 因果 关系 也 成 立 ， 正 如 下 列 引 理 给 出 的 证 明 那 样 。 

引 理 6.19 如 果 信 道 不 具有 先进 先 出 性 质 ， SI < 2 也 成 立 。 

证 明 。 定 义 m, 满 足 Fo" 是 对 应 于 8 多 的 发 送 事件 ， 即 ， 在 它 的 第 hn 次 接收 事件 中 ，4 接 收 p 
的 第 ms 个 消息 。 由 因果 关系 的 定义 可 得 fer < gi, 

HAECH, RHEES, Mamaa. KASA, Efm, mp, PVA 
一 个 大 于 或 等 于 i。 选 择 j< i 满足 m) >i 现在 SO < Fo < gx 2, 口 

定理 6.20 相位 算法 (图 6-7 所 示 的 算法 ) 是 波动 算法 。 

证 明 。 因 为 每 个 进程 通过 信道 至 多 发 送 D 条 消息 ， 算 法 在 有 限 步 后 终止 。 设 y 是 算法 中 计 
算 C 的 终止 配置 ， 假 设 C 中 至 少 有 一 个 初始 进程 (可 能 有 多 个 )。 

为 表明 在 y 中 每 个 进程 已 经 做 过 判定 ， 首 先 证 明 ， 每 个 进程 至 少 已 经 发 送 -一 次 消息 。 因 为 
在 ) 的 信道 中 没有 消息 ， 对 于 每 个 信道 gp， 就 是 Rec, [gq] = Sent, 的 情况 。 同 时 ， 且 当 接 到 消息 
时 ， 每 个 进程 发 送 最 新 消息 ，Rec, [q] > 0 = Sent, > 0。 假 设 存在 有 一 个 初始 进程 po， H Sent, 
> 0， 这 殖 含 着 ， 对 于 每 个 p，Senp > 0。 i 

随后 证 明 每 个 进程 已 做 判定 。 设 p 是 y 中 变量 Sent 为 最 小 值 的 进程 ， 即 对 于 所 有 9，Senr > 
Sent, 。 特 别 对 于 4 是 p 的 和 近邻， 成立 。Rec, [q] = Sen Hg, min,Rec, [q] > Sent, 。 但 是 这 
AE Sent, = D; 否则 在 最 后 一 次 接 到 消息 的 时 候 ，p 就 会 发 送 了 附加 消息 。 因 而 ， 对 于 所 有 
P，Sents = D， 且 对 于 所 有 gqp，Rec, [q] = D， 这 表明 每 个 进程 确实 已 经 作 了 判定 。 

接 下 来 要 证 明 ， 每 个 进程 中 存在 一 个 事件 在 每 次 判定 之 前 发 生 。 如 果 P = po, pi, as Pis 
是 网 络 中 的 一 条 路 径 ， 且 /< D, BBA 816.19, 





fon < (1+1) 
Pipal 一 E pipin 


~ 
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对 于 0 <i<l, HAH 
Brom < Forte 
对 于 0 < i< 1-1。 从 而 ， 有 3 8am 。 因 为 网 络 直 径 为 D， 对 于 每 一 gq 和 p， 存 在 长 度 至 
多 为 D 的 路 径 g = po，p!，.….，p1 = p。 因 此 对 于 每 个 9， 存在 1 < D， 且 p 的 人 近邻 满足 fy x 


sg 。 由 算法 ，8g0 在 d 之 前 。 














cons D : integer = the network diameter ; 
var Rec,(q] : 0..D init 0, for each q € In, ; 
(* Number of messages received from q *) 
Sentp :0..D init 0 ; 
(* Number of messages sent to each out-neighbor *) 


begin if p is initiator then 
begin forall r € Out, do send (tok) tor ; 
Senty := Sent, +1 
end ; 


while ming Recplg] < D do 
begin receive (tok) (from neighbor qo) ; 
Recplqo] := Recp[qo] +1 ; 
if ming Recp|q] > Sentp and Sent, < D then 
begin forall r € Out, do send (tok) tor; 
Senty := Sentp +1 


end 
end ; 
decide 
end 





图 6-7 相位 算法 


算法 通过 每 个 信道 发 送 D 条 消息 ， 使 得 消息 复杂 度 为 | 下. D。 应 该 注意 ， 在 这 个 表达 式 中 ， 
IE| 表 示 有 向 信道 的 数量 。 如 果 将 算法 用 于 无 向 网 络 ， 每 个 信道 相当 两 个 有 向 信道 。 这 使 得 消 
息 的 复杂 度 为 2IE1 - D. 

2. 团 网 中 的 相位 算法 

如 果 了 网络 是 直径 为 1 的 团 。 在 这 种 情况 下 ， 只 接收 每 个 近邻 的 一 条 消息 ， 每 个 进程 只 需 计 
算 它 所 接收 消息 的 总 数 就 足够 了 。 而 不 需 分 别 计算 每 个 人 近邻 的 消息 数 ， 参 见 图 6-8 所 示 的 算 
法 。 消 息 复杂 度 为 N(N-1)。 算 法 仅 用 了 O(log N) 位 的 内 部 存储 空间 。 


6.2.6 Finn 算 法 


Finn 算 法 [Fin79) 是 另 一 种 波动 算法 ， 可 用 于 任意 的 有 向 网 络 中 。 它 不 要 求 预先 知道 网 
络 直径 ， 但 是 要 求 有 可 用 的 进程 惟一 标识 。 在 消息 中 交换 进程 的 标识 集 ， 这 使 得 算法 的 位 复 
杂 度 相当 高 。 

进程 p 维 持 进 程 标 识 的 两 个 集合 ，Inc, 和 NInc, 。 非 形式 地 讲 ， Incp 是 进程 q 的 集合 ， 满 足 : 
4 中 的 事件 在 p 中 最 近 事件 之 前 发 生 ，Nijnc, 是 进程 g 的 集合 ， 满足 对 于 所 有 4 的 近邻 ”，r 中 的 事 
件 在 p 中 最 近 事件 之 前 发 生 。 关 系 维持 如 下 。 初 始 时 ，Inc, = {p} 和 Ninc, = 名。 进程 p 发 送 包 括 
Inc, 和 Nincn 的 消息 ， 每 次 ， 其 中 一 个 集合 增加 。 当 pP 接 收 到 包括 7mc 集 和 Nizc 集 的 消息 时 ， 所 
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收 到 的 这 些 标识 被 插入 到 这 些 集合 的 p 中 。 当 z 收 到 所 有 和 近邻 的 一 条 消息 时 ，p 被 插入 到 
Nincr 中 。 当 两 个 集合 相等 时 ，P 进 行 判定 。 参 见 图 6-9 所 示 的 算法 。 两 个 集合 的 非 形式 上 的 含 
义 是 ， 对 于 每 个 进程 4， 满 足 4 中 的 事件 先 于 de ， 对 于 4 的 每 个 近邻 ”>，r 中 的 事件 也 先 于 d， 这 
强 含 算法 的 相关 性 。 

在 正确 性 证 明 中 表明 ，、 对 于 每 个 p>， 两 个 集合 相等 萤 含 着 每 个 进程 中 存在 事件 在 判定 事件 
之 前 发 生 。 

var Rec, :0.N-—1 init 0; 
(* Number of messages received *) 


Sentp : 0.1 init 0; 
(* Number of messages sent to each neighbor *) 


begin if p is initiator then 
begin forall r € Neigh, do send (tok) tor ; 
Senty := Sentp 十 1 


end ; 
while Rec, < #Neigh, do 


begin receive (tok) ; 
Recp := Recp +1; 
if Sent, = 0 then 
begin forall r € Neigh, do send (tok) tor ; 
Senty := Sent, #1 
end 
end ; 
decide 
end 





图 6-8 MRIH 


定理 6.21 Finn 算 法 (图 6-9 所 示 的 算法 ) 是 波动 算法 。 

证 明 。 观 察 进程 所 保持 的 两 个 集合 ， 只 能 增 大 。 因 为 在 第 一 条 消息 通过 每 个 信道 发 送 时 ， 
两 个 集合 大 小 相 加 至 少 为 1。 在 最 后 一 条 消息 通过 每 个 信道 发 送 时 ， 这 两 个 集合 大 小 相 加 至 多 
为 2W， 因 此 消息 总 数 界限 为 2N < E 

设 C 是 一 次 计算 ， 其 中 至 少 有 一 个 初始 进程 ， 设 y 是 最 终 配置 ， 即 终止 配置 。 如 同 定理 
6.20 的 证 明 ， 可 得 如 果 进 程 p 至 少 已 经 向 每 个 近邻 发 送 一 次 消息 ，4 是 p 的 出 近邻 ， 那 么 q 也 至 
少 发 送 一 次 消息 。 这 蕴含 着 每 个 进程 至 少 已 经 发 送 一 条 消息 (通过 每 个 信道 )。 

要 证 在 ?中 每 个 进程 已 经 判定 。 首 先 ， 如 果 存在 边 pg， 那 么 在 ?中 jc S Inc,。 在 lInc, 的 最 
后 改变 之 后 ， 进 程 p 发 送 消息 <sets ，Inc。，NInc, >。 在 接收 消息 之 后 ， 进程 4 执行 语句 imcy := 
Inc, U Inc,。 网 络 的 强 连 通 性 表明 ， 对 于 所 有 p 和 gq，Inc, = Inc,。 由 于 p E jznc 成 立 ， 每 个 jnc 集 
合 只 包含 进程 标识 ， 因 此 对 于 每 个 p，Inc, = P 成 立 。 

其 次 ， 对 于 每 个 p 和 4q， 类 似 地 可 以 证 明 NInc, = NInc,。 因 为 每 个 进程 通过 每 个 信道 上 至 少 
发 送 一 条 消息 ， 每 个 进程 满足 Ye E In: rec, [q]， 因 而 ， 对 于 每 个 5，p E NInc, 成 立 。 同 时 ， 
Ninc 集 合 只 包含 进程 标识 ， 这 蕴含 着 对 于 每 个 >，NInc, = P 成 立 。 由 Inc, = P 和 Ninc, = P 可 得 ， 
Inc, = NInc, ， 因 此 每 个 进程 p 在 y 中 已 经 判定 。 

还 需 证 明 ， 每 个 进程 中 存在 事件 在 进程 p 中 的 判定 事件 心 之 前 发 生 。 对 于 进程 p 中 的 事件 e， 
设 Inc® (或 Nince， 分 别 地 ) 表示 执行 事件 e 之 后 的 Inc, (或 NInc,， 分 别 地 ) 的 值 (参考 定理 
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6.12 的 证 明 )。 下 面 的 两 个 声明 形式 化 了 本 节 开 始 时 的 非 形式 化 的 集合 描述 。 

声明 6.22 如果 存 在 事件 ecE C,: e Xf, MA. gEinc, 

证 明 。 如 同 定理 6.12 的 证 明 ， 由 e < f= Inc © nct, He €C, = qE inc, BRE 
证 。 口 

声明 6.23 如 果 g E Ninrcn， 那 么 ， 对 于 所 有 r E jn ， 存 在 事件 eE Ce Xf. 

证 明 。 设 au 是 进程 q 第 一 次 执行 Nincy := Ninc, U {9} 的 内 部 事件 。 事 件 o, 是 9 E Ninc wo 中 
的 惟一 事件 ， 并 且 对 于 满足 q E Nmn ?的 另 一 事件 w'，a' 不 在 事件 cy 之 前 。 于 是 4 E Nirc0 = a, 
Z fo 

算法 表明 ， 对 于 每 个 r € 1n,， 存 在 事件 e E C,， 在 a, 之 前 。 结 果 得 证 。 

(24 Inc, = Ninc, 时 ， 进 程 p 才 进行 判定 。 记 为 Inc“ 人 p= NInc<p， 它 满足 如 下 情形 

(1) pEInc; H 

(2) q E Inc? BS q E NincP eg &In, C Inc, 

由 网 络 的 强 连 通 性 可 得 ，1ncep) = 了。 














var Incep : set of processes init {p} ; 
NIncp : set of processes init Ø ; 
recp[q] : boolean for q€ In, init false ; 
(* indicates whether p has already received from q *) 


begin if p is initiator then 
forall r € Out, do send (sets, Incp, NIncp) to r ; 
while Inc, # NInc, do 

begin receive (sets, Inc, NInc) from qo ; 
Incp := Incy U Inc ; NIncp := NIncp U NIne ; 
recp[qo] := true ; 
if Vq € In, : recp[q] then NIncy := NIncs U {p} ; 
if Incp or NIncp has changed then 

forall r € Out, do send (sets, Incp, NInc,) to r 
end ; 





图 6-9 Finn 算 法 
6.3 遍历 算法 


本 节 讨论 一 类 特殊 的 波动 算法 。 即 ， 算 法 中 的 所 有 事件 是 因果 关系 上 的 全 序 。 其 中 的 最 
后 一 个 事件 与 第 一 个 事件 出 现在 同一 个 进程 中 。 

定义 6.24 遍历 算法 是 具有 以 下 性 质 的 算法 。 

(1) 这 次 计算 只 有 一 个 初始 进程 ， 只 发 送 一 条 消息 开始 执行 算法 。 

(2) 进程 一 接 到 消息 ， 就 发 送出 一 条 消息 ， 或 者 进行 判定 。 

前 两 个 性 质 表 明 ， 在 每 次 有 限 计算 中 ， 只 有 一 个 进程 判定 。 在 一 个 进程 判定 后 ， 称 算法 
是 终止 的 。 

(3) 算法 在 初始 进程 终止 ， 当 这 种 情况 发 生 时 ， 每 个 进程 至 少 已 经 发 送 一 次 消息 。 

在 遍历 算法 的 每 个 可 达 配置 中 ， 或 者 只 有 一 条 消息 在 传输 ， 或 者 只 有 -一个 进程 已 经 收 到 
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消息 并 且 还 没有 发 送 应 答 消息 。 从 更 抽象 的 观点 来 看 ， 计 算 中 的 所 有 消息 可 被 看 作 一 个 对 象 
( 令 牌 )， 被 从 一 个 进程 传 给 另 一 个 进程 ， 因 此 能 够 “访问 ” 所 有 进程 。 在 7.4 节 中 ， 遍 历 算法 
用 于 构造 选举 算法 。 为 此 ， 不 仅 需要 知道 在 一 次 波动 中 所 传递 的 令 牌 总 数 ， 而 且 还 要 知道 访 
问 前 x 个 进程 需要 传递 的 令 牌 次 数 。 

定义 6.25 称 算 法 是 广 遍历 算法 〈 对 于 一 类 网 络 )， 如 果 

(1) 算法 是 遍历 算法 (对 于 这 类 网 络 )， 且 

(2) 在 每 次 计算 中 ,传递 f(x) 次 令 牌 之 后 ， 至 少 访问 了 min(N，x+1) 个 进程 。 

环 网 算法 (图 6-2 所 示 的 算法 ) 是 遍历 算法 ， 因 为 在 x 步 后 (x < N)，x+1 个 进程 已 经 处 理 
了 令 牌 ，N 步 之 后 ， 所 有 进程 已 经 处 理 了 令 牌 。 因 此 环 网 算法 是 x- 遍 历 算法 。 


6.3.1 遍历 团 


用 顺序 轮 询 算法 可 以 遍历 团 ; 算法 非常 像 图 6-6 所 示 的 算法 。 但 是 一 次 只 对 初始 进程 的 一 
个 近邻 轮 询 。 仅 当 接 到 一 个 近邻 的 应 答 之 后 ， 才 轮 询 下 一 个 近邻 。 参 见 图 6-10 所 示 的 算法 。 


var rec, : integer init 0; (* for initiator only *) 


For the initiator: 
(* Write Neigh, = {q1, 92, ..., qnN—1} *) 
begin while rec, < #Neigh, do 
begin send (tok) to grec, +1 ; 
receive (tok); recp :一 recp + 1 
end ; 
decide 
end 


For non-initiators: 
begin receive (tok) from q ; send (tok) to q end 





图 6-10 顺序 轮 询 算法 


定理 6.26 顺序 轮 询 算 法 (图 6-10 所 示 的 算法 ) 是 团 的 2x- 遍 历 算 法 。 
证 明 。 易 见 ， 当 算法 终止 于 初始 进程 时 ， 每 个 进程 都 已 经 发 送 了 应 答 。 第 (2x-1) 条 消 
息 是 对 9, 的 轮 询 ， 第 2x 条 消息 是 它 的 应 答 。 因 此 ， 当 交换 了 2x 条 消息 时 ， 就 已 经 访问 了 x+1 个 
进程 P， qis wo axo O 


6.3.2 遍历 圆 环 


nxn 的 回环 图 是 图 G = (V, E), Hh 
V=Z,*Z,={(i, j) O< i, j<n} 





且 
E={ (门人 站 :=PAJ=Ptl) V (isi t1Ajz=j') } 
参见 B.2.4 节 。( 这 里 加 减 以 ”为 模 。) 假设 圆 环 可 以 进行 方向 侦 听 (参见 B.3 节 )， 即 ， 在 
节点 G, j) 上 到 (i, j+1) 的 信道 标 以 Up, 到 (i, j-1) 的 信道 标 以 Down， 到 (i+1, j) 的 
庆 道 标 以 Right， 到 (i-1,j) 的 信道 标 以 Leffr， 坐 标 对 (i，j) 是 定义 网 络 拓扑 结构 和 它 的 方 





122 oR RKK 法 


向 侦 听 的 便利 工具 但 假设 进程 并 不 知道 这 些 坐 标 。 拓 扑 知 识 仅 限于 信道 标号 上 。 
圆 环 是 哈密 尔 顿 图 ， 即 在 任意 大 小 的 圆 环 中 存在 哈密 尔 顿 回路 。 利 用 图 6-11 所 示 的 算法 
沿 着 这 个 回路 发 送 令 牌 。 在 令 牌 的 第 K 步 后 ， 如 果 n |k (WRK) 为 真 ， 令 牌 向 上 发 送 ， 否 则 令 
牌 向 右 发 送 。 
For the initiator, execute once: 


send (num,1) to Up 


For each process, upon receipt of the token (num, k}: 


begin if k = n? then decide 
else if nlk then send (num, k +1) to Up 
else send (num,k +1) to Right 


end 





图 6-11 圆 环 遍历 算法 


定理 6.27 回环 算法 (图 6-11 所 示 的 算法 ) 是 圈 环 的 Xx- 遍历 算法 。 

证 明 。 从 算法 中 易 见 ， 在 令 牌 传递 n? 次 之 后 ， 发 生 判 定 。 如 果 令 牌 从 p 到 g 的 移动 是 进行 
向 上 的 U 次 移动 和 向 右 的 R 次 移动 ， 那 么 p = q 当 且 仅 当 (MUA nlR)。 设 初始 进程 为 pp，p4 是 接 
到 令 牌 <znum、 忆 的 进程 。 

在 传递 令 牌 的 zn? 步 中 ， 有 n 步 是 向 上 的 ， 其 余 的 mr?-n 步 是 向 右 的 。 因 为 x 和 nn?-n 都 是 x 的 倍 
数 ， 因 此 可 得 ，pe= po。， 因 此 算法 在 初始 进程 终止 。 

以 下 证 明 ， 进 程 po 到 pw2-! 互 不 相同 。 因 为 有 个 进程 ， 这 萤 含 着 ， 每 个 进程 都 被 访问 。 假 
设 对 于 所 有 0 < a < b <n, pa= pb。 在 ps 和 ps 之 间 ， 令 牌 已 经 做 了 一 些 向 上 移动 和 一 些 向 右 移 
动 ， 且 由 于 p.= ps 这 两 个 方向 的 移动 数 都 是 a 的 倍数 。 由 算法 可 见 l 


#{k:a <k<b A nik yn 
和 
#{k :a < k<b 人 n 人 上 k} 是 n 的 倍数 


这 两 个 集合 大 小 之 和 为 8b-a， 由 此 可 得 , ma | ( b-a )。 记 (b-a) =1.n, BARAL k: a 
< <b} 包 含 k 的 ! 倍 。 这 蕴含 着 ,，n | 1!。 于 是 ,mr? |(b-a), 矛盾 。 
因为 进程 mo. pz-, 互 不 相同 。 在 令 牌 传递 zx 次 之 后 ， 访 问 了 x+1 个 进程 。 口 


6.3.3 遍历 超 立 方 体 


nM REG = (V, E), eh 
V={ (bo, e.. b,-1): b,=0, 1} 


和 

E= {(bo, ..., bni), (Cos ..., cr-D : b 和 c 只 在 某 一 位 上 不 同 }; 

参见 B.2.5 小 节 。 假 设 超 立 方 体 上 可 以 进行 方向 债 听 ，( 参 见 B.3 节 )， 即 ， 在 节点 b 和 c 之 间 
的 信道 上 标 以 :， 其 中 b 和 ec 的 二 进 制 数 在 第 ;位 不 同 。 但 假设 进程 并 不 知道 这 些 节 点 标号 。 拓 扑 
知识 仅 限 于 信道 标号 上 。 

就 像 回环 ， 超 立方 体 是 哈密 尔 顿 回路 ， 利用 图 6-12 所 示 的 算法 可 以 遍历 哈密 尔 顿 回路 。 
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算法 的 正确 性 证 明 几 乎 与 图 6-11 所 示 的 算法 的 正确 性 证 明 一 样 。 
For the initiator, execute once: 
send ( num, 1) through channel n — 1 . 


For each process, upon receipt of the token (num, k): 
begin if k = 2" then decide 


else begin let / the largest number s.t. 2'|k ; 
send ( num, k + 1) through channel / 


end 





图 6-12 超 立 方 体 遍 历 算法 


定理 6.28 超 立 方 体 算法 (图 6-12 所 示 的 算法 ) 是 超 立 方 体 上 的 六- 遍历 算法 。 
证 明 。 由 算法 可 见 ， 令 牌 在 经 过 2" 次 跳跃 后 ， 发 生 判 定 。 设 初始 进程 为 pp，pi 是 收 到 令 牌 
<num， 旋 的 进程 。 对 于 每 个 k < 2*"，pi 和 pw 的 标号 只 有 一 位 不 同 ， 用 1(k) 表示 下 标 ， 满 足 
n-l 如 果 k =0 
K(k) = la largest / with 2' Ik 如 果 k>0 
因为 对 于 每 个 i < nx， 有 偶数 个 KE {0，...，2"} 且 Lk) =i, p= pm， 因此 判定 发 生 在 初始 
进程 中 。 类 似 于 定理 6.27 的 证 明 ， 可 以 证 明 p。 = ps 蕴含 着 2" |( 5b-a)。 这 表明 所 有 进程 po … pons 
互 不 相同 。 
由 此 可 得 ， 当 终止 时 ， 所 有 进程 已 被 访问 过 ， 在 传递 令 牌 x 次 之 后 ， 访 问 了 x+1 个 进程 。 
o 


6.3.4 遍历 连通 网 络 


Tarry[T1895]1895 给 出 了 连通 网 络 的 遍历 算法 。 算 法 按照 以 下 两 个 规则 形成 ， 参 见 算法 
6-13, 

Rl 进程 从 不 在 同一 信道 转发 两 次 令 牌 。 

R2 按照 规则 R1， 仅 当 没 有 其 他 信道 可 用 时 ， 非 初始 进程 才 将 令 牌 转发 给 其 父 节点 〈 即 

非 初始 进程 第 一 次 从 其 处 接 到 令 牌 的 近邻 节点 )。 

定理 6.29 Tarry 算 法 (图 6-13 所 示 的 算法 ) 是 遍历 算法 。 

证 明 。 因 为 令 牌 在 各 信道 的 每 个 方向 至 多 发 送 一 次 ， 在 算法 终止 之 前 ， 它 至 多 被 传递 AE 
次 。 因 为 通过 每 个 信道 ， 每 个 进程 至 多 发 送 一 次 令 牌 至 多 接收 一 次 令 牌 。 每 次 当 非 初始 进程 p 
持 有 令 牌 时 ， 进 程 p 的 接收 次 数 比 发 送 次 数 多 一 次 。 这 蕴含 着 依附 于 p 的 信道 数 超 过 p 所 用 的 信 
道 数 至 少 一 个 ， 于 是 p 没 有 判定 ， 而 是 转发 令 牌 。 由 此 可 得 ， 判 定 在 初始 进程 发 生 。 

我 们 分 三 步 证 明 ， 当 算法 终止 时 ， 每 个 进程 已 经 转发 了 令 牌 。 

(1) 所 有 依附 于 初始 进程 的 信道 在 每 个 方向 已 用 一 次 。 

初始 进程 已 经 使 用 每 个 信道 发 送 令 牌 ， 否 则 算法 将 不 会 终止 。 初 始 进程 接收 令 牌 的 次 数 
恰恰 等 于 它 发 送 令 牌 的 次 数 。 由 于 每 次 通过 不 同 的 信道 接收 ， 因 此 令 牌 通过 每 个 信道 被 接收 
一 次。 

(2) 对 于 每 个 被 访问 的 进程 p， 依附 于 p 的 所 有 信道 在 每 个 方向 上 已 经 被 用 一 次 。 

假设 不 是 这 种 情况 。 选 择 p 为 第 一 个 不 满足 这 种 性 质 的 被 访 进 程 ， 由 (1) 可 见 ，p 不 是 初 
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始 进程 。 由 p 的 选择 ， 所 有 依附 于 farher, 的 信道 在 每 个 方向 上 已 被 使 用 一 次 ， 这 表明 ，p 已 经 
向 其 父 季 点 发 送 了 令 牌 。 这 蕴含 着 ，p 已 经 使 用 了 所 有 依附 的 信道 发 送 令 牌 ;但 由 于 令 牌 结束 
于 初始 进程 。p 收 到 的 令 牌 数 恰好 和 p 发 送 的 令 牌 数 相等 。 因 此 p 通 过 每 个 依附 的 信道 楼 到 一 次 










var usedplq] : boolean init false for each q € Neigh, ; 
(* Indicates whether p has already sent to g *) 
father, : process init udef ; 


For the initiator only, execute once: 
begin father, := p ; choose q € Neigh, ; 
used,|q] := true ; send (tok) to q 
end 





For each process, upon receipt of (tok) from qo: 
begin if father, = udef then father, := qo ; 
if Vg € Neigh, : usedp|q] 
then decide 
else if 3q € Neigh, : (q # father, A -usedplg]) 
then begin choose q € Neigh, \ {father} 
with sused,|q] ; 
used,|q] := true ; send (tok) to q 







en 
else begin wsedp[father,] := true ; 
send (tok) to father, 





end 





图 6-13 Tarry 的 遍历 算法 


(3) 所 有 进程 已 被 访问 ， 每 个 信道 在 两 个 方向 上 被 用 一 次 。 如 果 存在 未 被 访问 的 进程 ， 
则 存在 近邻 p 和 94， 满足 p 已 被 访问 ,4 未 被 访问 ， 这 与 p 的 各 信道 在 两 个 方向 已 被 使 用 发 生 了 矛盾。 
因此 由 (2) 可 得 ， 所 有 进程 被 访问 ， 所 有 信道 在 两 个 方向 上 只 用 一 次 。 
Tarry 算 法 的 每 次 计算 定义 了 引 理 6.3 中 所 示 的 网 络 的 一 棵 生成 树 。 树 根 是 初始 进程 ， 在 计 
算 的 最 后 ， 每 一 个 非 初始 进程 p 将 其 父 节点 存储 在 树 中 的 变量 farher, 中 。 如 果 想 要 每 个 进程 知 














。 道 (在 计算 的 最 后 ) 其 近邻 中 哪些 是 其 子 节点 ， 可 以 通过 将 特殊 消息 发 给 father, 实 现 。 


6.4 深度 优先 搜索 的 时 间 复 杂 度 


Tarry 算 法 中 的 进程 具有 足够 的 自由 度 ， 在 选择 要 向 其 转发 令 牌 的 近邻 中 ， 和 允许 出 现 许 多 
类 生成 树 。 本 节 要 讨论 的 算法 是 如 何 计算 具有 其 他 性 质 的 生成 树 ， 每 一 条 非 树 边 连接 两 个 节 
点 ， 其 中 一 个 是 另 一 个 的 祖先 。 非 树 边 是 不 属于 生成 树 的 边 。 BEECH RA BLE RET, 
T[p] 表 示 p 的 子 树 中 的 进程 集合 ，4[p] 表 示 p 的 祖先 ， 即 ， 7 中 根 与 p 之 间 的 路 径 上 的 那些 节点 。 
观察 可 见 ，g € Tp] > p E Alq). 

定义 6.30 对 于 每 一 非 树 边 pg,，g E Tip] Vq E 4[g]，G 的 有 根 生成 树 7 是 一 棵 深度 优先 
搜索 树 。 

深度 优先 搜索 树 可 用 于 许多 图 的 算法 中 ， 例 如 测试 图 的 平面 性 ， 测试 双 连 通 性 ， 区 间 标 
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号 模式 的 构造 (参见 4.4.2 节 )。6.4.1 节 表明 ， 对 Tarry 算 法 稍 做 修改 ( 即 ， 限 制 选择 进程 的 自 
由 度 )， 就 可 以 使 算法 用 于 计算 深度 优先 搜索 树 。 经 修改 的 最 终 算 法 称 为 经 典 深度 优先 搜索 算 
法 (classical depth-first search algorithm )。6.4.2 节 讨论 了 两 种 深度 优先 搜索 算法 ， 它 们 能 用 
比 经 典 算法 少 的 时 间 计 算 深度 优先 搜索 树 。 因 此 ， 以 下 将 定义 分 布 式 算法 的 时 间 复 杂 度 。 
6.4.3 节 提出 了 一 种 具有 初始 近邻 标识 知识 的 网 络 的 深度 优先 搜索 算法 。 在 这 种 情况 下 ， 不 能 
应 用 定理 6.6， 实 际 上 ， 给 出 了 只 用 2Nw-2 条 消息 的 算法 。 

分 布 式 算法 的 时 间 复杂 度 。 异 步 网 络 的 传输 时 间 未 知 ， 我 们 的 分 析 并 不 依赖 于 对 系统 有 
特定 要 求 的 参数 。 回 忆 一 下 在 串 行 计算 中 ， 时 间 复 杂 度 并 没有 表示 成 物理 时 间 单 元 ， 而 是 表 
示 成 指令 数 。 这 里 我 们 同样 这 样 做 。 用 执行 中 最 长 的 消息 延迟 作为 度量 分 布 式 执 行 期 间 的 时 
间 单位 。 用 公理 定义 该 时 间 单 位 ， 每 个 消息 延迟 都 受到 该 时 间 单 位 的 限定 因此 以 下 的 T2 并 不 
真是 关于 计算 的 一 种 假设 ， 而 是 关于 时 间 单 位 的 一 种 声明 。 

定义 6.31 分 布 式 算法 的 时 间 复 杂 度 定义 为 算法 的 一 次 计算 的 最 大 时 间 。 满 足下 列 假设 : 

Tl 进程 在 0 个 时 间 内 ， 可 以 执行 任意 有 限 个 事件 。 

T2 消息 的 发 送 和 接收 之 间 的 时 间 至 多 一 个 时 间 单 位 。 

本 章 所 有 波动 算法 的 时 间 复 杂 度 参见 表 6-19。 表 中 没有 证 明 的 算法 复杂 度 作 为 练习 留 给 
读者 。6.5.3 小 节 讨 论 另 一 种 时 间 复 杂 度 的 定义 。 

引 理 6.32 对 于 遍历 算法 ， 其 时 间 复 杂 度 等 于 消息 复杂 度 。 

证 明 。 消 息 的 交换 是 顺序 的 ， 每 次 交换 需要 一 个 单位 时 间 。 


6.4.1 分 布 式 深度 优先 搜索 


如 果 用 以 下 第 3 条 规则 限制 Tarry 算 法 中 选择 一 个 近邻 来 转发 令 牌 的 自由 度 ， 就 得 到 经 典 深 
度 优先 算法 ， 参 见 图 6-14 所 示 的 算法 。 

R 当 进 程 收 到 所 发 送 的 令 牌 时 ， 如 果 规 则 R1 和 R2 人 允许 ， 进 程 就 通过 相同 信道 将 其 发 送 回去 。 

定理 6.33 经典 深 度 优 先 搜索 算法 (图 6-14 所 示 的 算法 ) 利用 2IEI 条 消息 和 21EIl 个 时 间 单 
位 ， 计 算 一 棵 深度 优先 搜索 生成 树 。 

证 明 。 作 为 实现 Tarry 算 法 的 算法 ， 它 是 遍历 算法 ， 并 且 计 算 一 棵 生成 树 T7。 已 经 证 明 ， 每 
个 信道 携带 两 条 消息 (每 个 方向 一 条 消息 )， 这 就 证 明了 消息 的 复杂 度 进而 也 可 以 证 明 时 间 复 
杂 度 这 是 。 因 为 有 2IEI 条 消息 依次 交换 ， 每 次 交换 至 多 花 一 个 单位 时 间 。 接 下 来 要 主 规 则 R3 妾 
含 ， 其 结果 是 一 棵 深度 优先 搜索 树 。 

首先 ， 规 则 R3 昔 含 ， 非 树 边 的 第 一 次 遍历 之 后 ， 相 反方 向 紧 跟着 第 二 次 遍历 。 假设 pg 是 
非 树 边 ，p 是 利用 非 树 边 的 第 一 个 进程 。 当 g 接 到 p 的 令 牌 时 ，g 已 被 访问 过 (Bw, 4 就 会 将 
father。 设 置 为 ?， 边 也 不 是 非 树 边 )， 且 used,[p] 为 假 (因为 由 假设 ，p 是 这 两 个 进程 中 的 第 一 个 
利用 该 边 的 进程 )。 因 此 ， 由 R3，9 紧 接着 将 令 牌 发 回 p。 

可 以 证 明 ， 如 果 P4 是 首先 被 p 使 用 的 非 树 边 ， 那 么 ，g E 4[p]。 考 虑 令 牌 所 走 过 的 路 径 ， 
直到 经 pq 将 它 发 送 。 因 为 pg 是 非 树 边 ， 在 令 牌 经 过 pg 这 条 边 到 达 g 之 前 ， 4 已 被 访问 过 : 


+9 Jo wes Ps 
由 此 路 径 ， 通 过 用 六 替换 所 有 模式 r,， 刀 ，~ ， 就 能 得 到 更 短 的 一 条 路 经 ， 其 中 rirs 是 非 树 
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边 。 根 据 以 前 的 观察 ， 所 有 非 树 边 现 在 已 被 删除 ， 这 前 含 着 所 得 路 径 是 T 中 的 一 条 路 径 ， 仅 仅 
是 由 pq 第 一 次 使 用 之 前 所 用 的 边 组 成 。 如 果 4q 不 是 p 的 祖先 ， 这 曾 含 着 从 g 到 father, 的 边 在 边 gp 
被 使 用 之 前 已 经 得 到 使 用 ， 这 与 算法 中 的 规则 2 发 生 了 矛盾 。 口 





var usedplg] : boolean init false for each q € Neigh, ; 
(* Indicates whether p has already sent to q *) 
father, : process init udef ; 


For the initiator only, execute once: 
begin father, := p ; choose q € Neigh, ; 
usedplq] := true ; send (tok) to q 
end 


For each process, upon receipt of (tok) from go: 
begin if father, = udef then father, := qo ; 
if Vg € Neigh, : used,|q] 
then decide 
else if 3q € Neigh, : (q # father, A >used,|q]) 
then begin if father, # qo A ~used [qo] 
then q := go 
else choose q € Neigh, \ {father,} 
with ~usedp[q}) ; 
used,|q] := true ; send (tok) to q 
end 
else begin used,[father,] := true ; 
send (tok) to father, 
end 





图 6-14 经 典 深 度 优先 搜索 算法 


经 典 分 布 式 优先 搜索 的 消息 复杂 度 为 21E1， 如 果 近 邻 标识 初始 时 未 知 ， 由 定理 6.6， 它 也 
是 最 优 的 (除了 一 个 常数 因子 2)。 算 法 的 时 间 复 杂 度 也 是 21Ei。 由 引 理 6.32， 这 可 能 是 在 这 种 
情况 下 的 遍历 算法 中 最 好 的 。Cheung[Che83] 首 先 给 出 了 深度 优先 搜索 的 分 布 式 算法 。 

在 6.4.2 小 节 ， 在 没有 近邻 标识 知识 的 情况 下 ， 讨 论 了 两 种 构造 网 络 中 深度 优先 搜索 树 的 
方法 ， 其 时 间 复 杂 度 为 O(N) 时 间 单 位 。 因 此 这 些 算法 不 是 遍历 算法 。 在 6.4.3 小 节 ， 在 利用 
近邻 知识 的 情况 下 ， 可 以 得 到 算法 的 消息 复杂 度 和 时 间 复 杂 度 为 O(N) 的 算法 。 


6.4.2 线性 时 间 的 深度 优先 搜索 算法 


经 典 深 度 优先 搜索 算法 具有 较 高 时 间 复 杂 度 的 原因 是 ， 所 有 边 ( 树 边 和 非 树 边 ) 按照 顺 
序 遍 历 。 令 牌 消息 <tok> 遍 历 所 有 非 树 边 并 且 紧 接着 返回 ， 正如 定理 6.33 中 证 明 的 那样 。 具 有 
较 低 时 间 复 杂 度 的 解决 方案 都 是 基于 这 样 一 个 原理 ， 即 ， 令 牌 消息 的 遍历 仅 通 过 树 边 ， 显 然 
遍历 只 需 线性 时 间 ， 因 为 只 有 N-1 条 树 边 。 

1. Awerbuch 解 决 方案 

算法 现在 包括 一 种 机 制 ， 禁 止 令 牌 通过 非 树 边 传输 。 在 Awerbuch[Awe85b] 算 法 中 ， 保 证 
当 一 个 进程 要 转发 令 牌 时 ， 知 道 哪 个 近邻 已 被 访问 。 然后 进程 选择 一 个 未 章 访问 的 近邻 进行 
转发 ， 如 果 近 邻 都 已 被 访问 过 ， 就 将 令 牌 发 给 自己 的 父 节 点 。 
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当 令 牌 首次 访问 进程 p 时 (对 于 初始 进程 ， 当 算法 开始 时 ， 就 会 出 现 这 种 情况 )， 进 程 p 通 
过 向 /发 送 消息 <vis>， 通知 每 个 近邻 /这 次 访问 ， 除 了 它 的 父 节 点 。 令 牌 的 转发 将 被 挂 起 ， 直 
到 p 收 到 每 个 近邻 的 消息 <ack>。 这 保证 在 进程 p 转 发 令 牌 的 时 刻 p 的 每 个 近邻 "知道 p 已 被 访问 
过 。 当 稍 后 令 牌 到 达 r 时 ，r 不 会 将 令 牌 转发 给 p>， 除 非 p 是 r 的 父 节点 。 参 见 图 6-15 所 示 的 算法 。 

在 大 多 数 情况 下 ， 消 息 <vis> 的 交换 引起 used, ather, ] 为 真 ， 即 使 是 p 还 未 将 令 牌 发 给 其 
父 节 点 时 。 因 此 ， 在 算法 中 ， 必 须 进 行 详细 的 程序 设计 使 得 只 有 初始 进程 才能 判定 。 对 于 所 
有 近邻 9， 使 得 used, [q] 为 真 的 非 初 始 进程 p 将 令 牌 转发 给 其 父 节 点 。 


var used,|q] : boolean init false for each q € Neigh, ; 


(* Indicates whether p has already sent to q *) 
father,  : process init udef ; 


For the initiator only, execute once: 
begin father, := p ; choose q € Neigh, ; 
forall r € Neigh, do send (vis) tor ; 
forall r € Neigh, do receive (ack) from r ; 
used,|q] := true ; send (tok) to q 
end 


For each process, upon receipt of (tok) from go: 
begin if father, = udef then 
begin father, := qo ; 
forall re Neigh, \ {father,} do send (vis) to r ; 
forall r € Neigh, \ {father,} do receive (ack) from r 
end ; 
if p is the initiator and Yq € Neigh, : usedplq] 
then decide 
else if Jq € Neigh, : (q # father, ^ -used,[q]) 
then begin if father, # qo A —usedplqo] 
then q := qo 
else choose ge Neigh, \ {father } 
with -used,(q] ; 
used,[q] := true ; send (tok) to q 
end 
else begin used,[father,] := true ; 
send (tok) to father, 
end 
end 


For each process, upon receipt of (vis) from qo: 
begin vsedp[ao] := true ; send (ack) to go end 





图 6-15 AWERBUCH 深 度 优先 搜索 算法 
定理 6.34 Awerbuch 算 法 (图 6-15 所 示 的 算法 ) 利用 4N-2 个 时 间 单 位 和 4 - EIR H e, H 
算 一 棵 深度 优先 搜索 生成 树 。 
证 明 。 如 同 图 6-14 所 示 算 法 ， 实 际 上 通过 相同 信道 发 送 令 牌 ， 除 了 通过 非 树 边 的 发 送 以 
外 。 因 为 对 任何 进程 >， 通 过 非 树 边 的 传输 并 不 影响 /other, 的 最 终 值 ， 其 所 得 树 总 是 图 6-14 所 
示 的 算法 的 一 种 可 能 结果 。 
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令 牌 顺序 遍历 N-1 条 树 边 中 的 每 条 边 两 次 ， 这 需要 2N-2 个 时 间 单 位 。 在 每 个 节点 上 ，, 令 
牌 被 转发 之 前 ， 至 多 等 待 一 次 。 对 于 消息 <vis>/<ack> 的 交换 ， 在 每 个 节点 上 引起 至 多 两 个 时 
间 单 位 的 延迟 。 

每 条 非 树 边 携带 两 条 <vis> 消 息 和 两 条 <ack> 消 息 。 每 条 树 边 携带 两 条 <tok> 消 息 ， 一 条 
<vis> 消 息 (从 父 节 点 到 子 节点 )， 一 条 <ack> 消 息 (从 子 节点 到 父 节 点 )。 因 此 交换 了 4 : EIR 
消息 。 口 
i 对 于 有 进程 向 其 转发 令 牌 的 近邻 ， 消 息 <vis> 的 发 送 可 以 省 略 。 这 种 改进 (图 6-15 所 示 的 
算法 中 没有 实现 ) 可 使 每 条 树 边 节省 两 条 消息 ， 从 而 使 得 消息 复杂 度 减 小 到 2N-2。 

2. Cidon 的 解决 方案 

通过 不 发 送 在 Awerbuch 算 法 中 使 用 的 <ack> 消息 ，Cidon [cid88] 算法 改进 了 Awerbuch 
算法 的 时 间 复 杂 度 。 在 Cidon 改 进 的 算法 中 ， 令 牌 的 转发 不 需 等 待 ， 即 没有 在 Awerbuch 算 法 中 
因 等 待 应 答 而 引起 的 两 个 时 间 单 位 的 延迟 。Lakshmanan 等 人 [LMT87] 提 出 了 相同 算 靶 。 下 面 
的 情况 可 能 出 现在 Cidon 算 法 中 。 进 程 p 已 被 令 牌 访问 过 ， 并 且 已 将 消息 <vis> 发 给 近邻 r。 令 
牌 稍 后 访问 +， 但 是 r 接 到 令 牌 时 ，p 的 消息 <vis> 可 能 还 未 到 达 r。 在 这 种 情况 下 ，r 可 能 将 令 牌 
转发 给 p， 实 际 上 ， 是 通过 非 树 边 发 送 。( 观 察 在 Awerbuch 算 法 中 ， 消 息 <ack> 是 如 何 防止 这 
种 情况 发 生 的 。) 

为 了 处 理 这 种 情况 ， 进 程 p 把 它 最 新 向 近邻 的 令 牌 发 送 记 录 在 变量 mrs, 中 。 当 令 牌 只 对 树 
边 进行 遍历 时 ， 下 一 次 进程 p 从 同一 近邻 mrsp 接 收 令 牌 。 上 面 定 义 的 这 种 情况 中 ， 进 程 p 从 不 
同 的 近邻 接收 <tok> 消 息 ， 即 从 r 接 收 。 在 这 种 情况 下 ， 和 忽略 了 令 牌 。 但 是 进程 p 将 边 rp 标记 为 
使 用 过 ， 就 好 像 消息 <vis> 从 ”已 经 被 接收 。 在 向 p 发 送 令 牌 之 后 ， 进 程 r 接 收 p 的 <vis> 消 息 ， 即 
/接收 近邻 mrsr 的 消息 <vis>。 在 这 种 情况 下 ，" 的 行为 就 好 像 它 还 没有 向 p 发 送 令 牌 ，r 选 择 下 
一 个 近邻 并 转发 令 牌 。 参 见 图 6-16 或 图 6-17 所 示 的 算法 。 


var usedplqj : boolean init false for each q € Neigh, ; 
father, : process init udef ; f 
mrsp : process init wdef; 


For the initiator only, execute once: 
begin father, := p ; choose q € Neigh, ; 
forall r € Neigh, do send (vis) tor ; 


used,|q] := true ; mrs, := q ; send (tok) toq 
en 


For each process, upon receipt of (vis) from qo: 
begin used, [go] := true ; 
if qo = mrs, then (* Interpret as (tok) message *) 
forward (tok) message as upon receipt of (tok) message 


end 





图 6-16 CIDON 深 度 优先 搜索 算法 (PART 1) 
定理 6.35 Cidon 的 算法 (图 6-16 或 图 6-17 所 示 的 算法 ) 利用 2N-2 个 时 间 单 位 和 4 . IEI 个 
消息 ， 计 算 一 探 深度 优先 搜索 生成 树 。 
证 明 。 令 牌 的 遍历 类 似 于 图 6-14 所 示 的 算法 中 的 遍历 。 如 在 图 6-15 所 示 的 算法 中 那 祥 ， 或 
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者 忽略 通过 非 树 边 的 传输 ， 或 者 令 牌 携带 消息 <vis> 穿 过 非 树 边 。 在 后 一 种 情况 下 ， 接 收 消息 
<vis> 的 进程 继续 转发 令 牌 ， 这 和 令 牌 通过 非 树 边 被 立刻 发 回 的 效果 一 样 。 


For each process, upon receipt of (tok) from qo: 
begin if mrs, # udef and mrs, £ qo 
(* This is a frond edge, interpret as (vis) message *) 
then used,[qo| := true 
else (* Act as in previous algorithm *) 

begin if father, = udef then 

begin father, := qo ; 
forall r € Neigh, \ {father ,} do 
send (vis) tor 
end ; 
if p is the initiator and Yq € Neigh, : usedplq] 

then decide 


else if Jq € Neigh, : (q # father, ^ ~usedp[a]) 
then begin if father, # qo A ~usedp[qo] 
then q := qo 
else choose g € Neigh, \ {father} 
with sused,|[q] ; 
usedy(q} := true ; mrsp := q ; 
send (tok) toq 


end 
else begin used,|father,] := true ; 
send (tok) to father, 
end 





图 6-17 CIDON 深 度 优先 搜索 算法 (PART 2) 


令 牌 通过 树 边 的 两 次 连续 传输 的 时 间 限定 为 一 个 时 间 单 位 。 如 果 令 牌 沿 着 树 边 在 时 刻 1 补 
发 送 到 p， 那 么 在 时 刻 :， 所 有 以 前 访问 过 的 p 的 近邻 4 的 <vis> 消 息 已 被 发 送 。 因 此 这 些 消息 在 
最 近 t+1 时 刻 到 达 。 即 使 在 时 刻 t+1 之 前 ，p 已 通过 非 树 边 发 送 几 次 令 牌 ， 那 么 在 时 刻 t+1， 最 近 
的 p 也 已 经 从 所 有 这 些 错误 中 恢复 ， 并 通过 树 边 转发 令 牌 。 因 为 必须 遍历 2N-2 条 树 边 ， 因 此 ， 
算法 在 2N-2 个 时 间 单 位 后 终止 。 

每 个 信道 至 多 传输 两 条 <vis> 消 息 和 两 条 <tok> 消 息 。 这 就 证 明 ， 消 息 的 复杂 度 为 4 . ||。 

Oj 

在 许多 情况 下 ， 算 法 中 发 送 的 消息 数 要 少 于 Awerbuch 算 法 中 的 消息 数 。 在 分 析 Cidon 算 法 
的 消息 数 时 ， 假 设 最 乐观 的 情况 ， 即 令 牌 消息 通过 非 树 边 在 两 个 方向 发 送 。 在 避免 许多 不 必 
要 的 传输 方面 ， 可 以 认为 <vis> 消 息 是 成 功 的 ， 在 那些 情况 下 ， 只 有 两 到 三 条 消息 通过 每 个 信 
道 传输 。 

根据 Cidon 观 察 ， 即 使 算法 可 能 发 送 令 牌 给 以 前 访问 过 的 节点 ， 它 也 有 上 比 图 6-15 所 示 的 算 
法 更 好 的 〈 通 信 ) 时 间 复 杂 度 ， 因 为 它 避 免 了 不 必要 的 传输 。 这 表明 从 不 必要 行为 中 恢复 过 
来 所 花费 的 时 间 和 消息 较 少 。Cidon 将 它 作为 一 个 公开 问题 ， 即 ， 是 否 存在 DFS 算 法 ， 其 消息 
复杂 度 达到 经 典 算法 的 消息 复杂 度 ， 即 21E1， 而 且 其 利用 O(N) 时 间 单 位 。 
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6.4.3 具有 近邻 知识 的 深度 优先 搜索 

如 果 进 程 知道 近邻 的 标识 ， 通 过 在 令 牌 中 包括 一 张 访 问 过 的 进程 的 表 ， 就 可 避免 令 牌 对 
非 树 边 的 遍历 。 进 程 p 接 到 带 有 表 的 令 牌 ， 并 不 将 令 牌 转发 给 Z 中 的 进程 。 可 以 省 略 变量 
usedb[9]。 因 为 如 果 p 以 前 已 经 把 令 牌 转发 给 9， 那 么 ，q EL; 参见 图 6-18 所 示 的 算法 。 


var father, : process init wudef; 


For the initiator only, execute once: 
begin father, := p ; choose q € Neigh, ; 
send (tlist, {p}) to q 
en 


For each process, upon receipt of (tlist, L) from qo: 
begin if father, = udef then father, := qo ; 
if 3g € Neigh, \ L 
then begin choose q € Neigh, \ L ; 
send ({tlist, L U fp} ) toq 
end 
else if p is initiator 
then decide 
else send (tlist, L U {p}) to father, 
end 





图 6-18 具有 近邻 知识 的 深度 优先 搜索 算法 


定理 6.36 ”具有 近邻 知识 的 DFS 算 法 是 遍历 算法 ， 利用 2N-2 条 消息 和 2N-2 个 时 间 单 位 ， 
计算 一 标 深 度 优 先 搜索 生成 树 。 

算法 的 位 复杂 度 高 。 如 果 w 是 表示 一 个 标识 需要 的 位 数 ， 则 表达 可 能 需要 N - w 位 。 参 见习 
题 6.14。 


6.5 遗留 问题 


6.5.1 波动 算法 综述 


表 6-1 给 出 了 本 章 所 考虑 的 波动 算法 。 以 Number 为 表 头 的 列表 示 本 章 中 的 算法 编号 ， 以 
5C/D 为 表 头 的 列表 示 算 法 是 集中 式 算法 (C) 还 是 分 散 式 算法 (D)。 列 T 表 示 算 法 是 否 是 遍历 
算法 。M 列 表示 消息 的 复杂 度 ，Time 为 表 头 的 列表 示 时 间 复杂 度 。 在 这 些 列 中 ， AN 表示 进程 数 ， 
IEl 是 信道 数 ，D 是 网 络 直径 (wb). 

大 多 数 拓扑 结构 网 络 中 ， 波 动 的 复杂 度 在 相当 程度 上 依赖 于 算法 属于 哪 一 种 类 型 ， 是 集 
中 式 算 法 还 是 分 散 式 算法 。 表 6-2 列 出 了 环 、 任意 网 和 树 的 集中 式 和 分 散 式 算法 的 消息 复杂 度 。 
以 同样 方式 ， 可 以 研究 复杂 度 对 其 他 参数 ， 如 近邻 知识 、 方 向 侦 听 等 的 依赖 性 (B.3 节 )。 


6.5.2 计算 和 


6.1.5 小 节 表 明 ， 一 次 波动 可 以 计算 出 所 有 进程 输入 的 下 确 界 。 下 确 界 的 计算 可 用 于 计算 
可 交换 的 、 可 结合 的 以 及 短 等 的 算 子 例如， 最 小 值 ， 最 大 值 等 (参见 推论 6.14)。 用 这 种 方 
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法 ， 大 量 的 国 数 是 不 可 计算 的 ， 这 些 国 数 包括 计算 所 有 输入 和 ， 因 为 和 算 子 不 是 寡 等 的 。 对 
输入 的 求 和 可 用 于 对 具有 某 一 性 质 的 进程 计数 (如 果 进 程 具有 这 种 性 质 ， 则 设置 为 1， 否 则 为 
0)， 本 节 的 结果 也 可 用 于 其 他 可 交换 的 和 可 结合 的 算 子 ， 如 求 整数 的 乘积 和 多 集 的 并 。 

并 不 存在 利用 波动 算法 的 计算 和 的 一 般 方法 。 但 在 特殊 情况 下 ， 计 算 和 是 可 能 的 ， 例 如 ， 
在 算法 是 遍历 算法 时 ， 进 程 有 标识 时 或 者 算法 包括 的 生成 树 可 用 时 。 

1. 一 般 构造 的 不 可 能 性 

利用 任何 一 种 任意 波动 算法 ， 不 可 能 给 出 计算 和 的 一 般 构 造 方法 ， 类 似 于 定理 6.12 计 算 下 
确 界 所 用 的 构造 方法 ， 如 下 所 示 。 对 于 一 类 网 络 ， 存 在 一 种 波动 算法 。 这 类 网 络 包括 所 有 直 
径 为 2 的 无 向 匿名 网 络 ， 即 相位 算法 (参数 D = 2)。 不 存在 一 种 算法 ， 可 以 计算 所 有 输入 的 


表 6-1 本 章 的 波动 算法 





算法 编号 拓扑 结构 c/D T M Time 
6.2 节 “一般 算法 
环 6.2 坏 C yes N N 
树 6.3 树 no N O(D) 
回 波 6.5 任意 C no 2IEI O(N) 
轮 询 6.6 H C no 2N-2 2 
相位 6.7 任意 D no 2D . IEI 2D 
困 上 相位 6.8 团 D no N(N-1) 2 
Finn 6.9 任意 D no <4-N- EI O(D) 
630 遍历 算法 
顺序 轮 询 6.10 C yes 2N-2 2N-2 
AR 6.11 圆 环 C yes N N 
超 立 方 6.12 超 立 方 C yes N N 
Tarry 6.13 任意 C yes 2161 2IEl 


经 典 算法 6.14 任意 C yes 2IEI 2iEt 
Awerbuch 6.15 任意 C no 4 -IEI 4N-2 
Cidon 6.16/6.17 任意 C no 4 ,加 2N-2 
近邻 知识 6.18 任意 C yes 2N-2 2N-2 


注 : 相位 算法 (图 6-7) 和 Finn 算 法 (图 6-9) 适用 于 有 向 网 络 。 


表 6-2 集中 式 算法 对 消息 复杂 度 的 影响 


拓扑 结构 C/D 复杂 度 参考 
eee 
环 C N 算法 (图 6-2) 
D O(N log N) 算法 (图 7-7) 
任意 C 2151 算法 (图 6-5) 
D O(N log N+IBI) 7.3 节 
树 C 2 (N-1) 算法 (图 6-5) 
D O (N) 算法 (图 6-3) 


和 ， 并 且 对 于 所 有 直径 为 2 的 无 向 匿名 网 络 都 是 正确 的 。 这 类 网 络 包括 两 种 网 络 ， 参 见 图 
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6-19 所 示 。 假 设 每 个 进程 有 输入 为 1， 图 中 左边 的 网 络 的 解 为 6， 右 边 网络 的 解 为 8。 利 用 第 9 
章 引 入 的 技术 ， 可 以 证 明 ， 对 于 任意 算法 ， 这 两 种 网 络 都 会 输出 同样 的 结果 ， 因 此 在 这 两 种 
网 络 中 ， 它 是 不 正确 的 。 论 证 的 详尽 细节 作为 习题 9.7 留 给 读者 。 

2. 用 遍历 算法 计算 和 

如 果 4 是 遍历 算法 ， 所 有 输入 的 和 可 如 下 
计算 。 进 程 7 有 变量 j, ， 初 始 化 为 p 的 输入 。 令 
牌 包括 一 个 另外 的 域 s。 无 论 什 么 时 候 p 转 发 令 
牌 ，p 都 执行 

s:=st+j,; j,:=0 

进而 可 以 证 明 ， 在 任何 时 刻 ， 对 于 每 个 曾 图 6-19 直径 为 ?和 度 为 3 的 两 个 网 络 
经 访问 过 的 进程 p, j。 = 0， 且 s 等 于 所 有 曾经 访问 过 的 进程 的 输入 和 。 因 此 ， 当 算法 终止 时 ，s 
等 于 所 有 输入 的 和 。 

3. 用 生成 树 计算 和 

对 于 进程 p 中 的 每 一 判定 事件 心 ， 有 些 波动 算法 可 用 于 根 为 p 的 生成 树 ， 经 过 这 棵 生成 树 ， 
消息 向 着 p 发 送 。 实 际 上 ， 波动 算法 的 每 次 计算 包含 这 样 的 生成 树 。 然 而 ,也 可 能 是 这 种 情况 ， 
进程 9 发 送 几 条 消息 ， 并 不 知道 输出 边 中 的 哪 一 个 属于 这 样 的 一 棵 生成 树 。 如 果 进 程 知道 哪 
条 输出 边 是 此 树 中 到 父 节 点 的 边 ， 那 么 这 棵 树 可 用 于 计算 和 。 每 个 进程 向 树 中 的 父 节 点 发 送 
消息 ， 则 所 有 输入 的 和 在 子 树 中 。 

这 个 原理 可 用 到 树 算法 ( 回 波 算法 ) 中 ， 也 可 用 于 团 的 相位 算法 中 。 从 p 到 g 所 发 送 的 消 
息 ， 在 树 算法 中 很 容易 包括 7,s 中 的 输入 和 。 判 定 进程 通过 计算 穿 过 一 条 边 的 两 个 消息 中 所 包 
含 的 值 ， 即 可 得 到 最 终结 果 。 同 样 对 于 团 相 位 算法 ， 它 将 g 的 输入 在 每 个 消息 中 从 g 发 至 p。 进 
程 p 将 所 有 接收 的 值 和 它 自己 的 输入 相 加 ， 当 p 判 定时 ， 其 结果 就 是 正确 的 答案 。 在 回 波 算法 
的 计算 过 程 中 ， 构 造 -一 棵 生成 树 ， 来 计算 输入 和 。 参 见习 题 6.15。 

4. 利用 标识 计算 和 

假设 每 个 进程 有 一 个 惟一 标识 。 如 下 计算 所 有 输入 的 和 。 每 个 进程 通过 形成 点 对 (P， j) 
用 它 的 标识 为 它 的 输入 做 出 标记 。 可 知 ， 不 存在 两 个 进程 具有 相同 的 点 对 。 算 法 保证 ， 当 进 
程 判 定时 ， 它 能 识别 出 每 个 输入 。5 = { (P, j): p © P} 表 示 p 的 所 有 集合 S$, = { (p, j) J 
并 集 ， 它 可 以 在 一 次 波动 中 计算 出 来 。 由 此 集合 ， 用 局 部 操作 即 可 计算 出 所 要 的 结果 。 

解决 方法 要 求 每 个 进程 具有 惟一 标识 ， 这 大 大 增加 了 位 复杂 度 。 波 动 算法 的 每 条 消息 包 
括 $ 的 一 个 子 集 ， 如 果 需 要 w 位 来 表示 一 个 标识 和 一 个 输入 ， 则 总 共 需 要 N . w 位 ， 参 见习 是 
6.16. 


6.5.3 时 间 复 杂 度 的 另 一 种 定义 

分 布 式 算法 的 时 间 复杂 度 可 以 按照 几 种 方式 定义 。 本 书 中 ， 在 讨论 时 间 复 杂 度 时 ， 总 是 
使 用 6.31 中 的 定义 。 这 里 讨论 其 他 一 些 可 能 的 定义 。 

1. 基于 更 严格 时 间 假 设 的 定义 

可 以 用 对 系统 中 的 事件 计时 的 更 严格 的 假设 来 估算 分 布 式 计算 所 消耗 的 时 间 。 

定义 6.37 算法 一 次 计算 的 最 大 时 间 定 义 为 算法 的 单位 时 间 复 杂 度 。 满 足以 下 假设 。 
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Ol 进程 在 0 个 时 间 内 ， 可 以 执行 任意 有 限 个 事件 。 

OD 消息 的 发 送 和 接收 之 间 的 时 间 恰 好 为 一 个 时 间 单位 。 

与 定义 6.31 比 较 ， 可 知 ， 假 设 01 与 T1 相 同 。 因 为 T2 假 设 的 传输 时 间 至 多 等 于 02 假 设 的 时 
间 ， 这 就 使 人们 可 能 认为 单位 时 间 复 杂 度 总 是 至 少 等 于 时 间 复 杂 度 。 因 此 ， 人 们 可 能 会 得 出 
在 T2 中 假设 的 每 次 计算 至 少 会 与 在 02 中 假设 的 一 样 快 。 因 此 ， 具 有 最 大 时 间 的 计算 在 T2 下 
并 不 比 02 下 更 差 。 这 种 论证 的 缺点 是 ， 按 照 T2， 所 允许 的 传输 时 间 上 的 变化 可 能 会 产生 更 大 
的 计算 ， 也 许 包括 时 间 性 能 较 差 的 计算 行为 。 回 忆 一 下 T2 的 定义 ， 它 并 不 是 对 要 度量 的 执行 
进行 限制 ， 而 是 一 种 时 间 单位 定义 。O2 实 际 上 将 执行 集合 限制 到 所 有 具有 相同 时 间 延 迟 的 消 
息 上 。 我 们 用 回 波 算法 说 明 这 一 点 。 

事实 上 ， 反 过 来 也 是 真 的 : 算法 的 时 间 复杂 度 至 少 等 于 那个 算法 的 单位 时 间 复杂 度 。 在 
假设 01 和 02 下 ， 所 允许 的 每 次 计算 同样 在 假设 TI 和 T2 下 也 允许 。 在 后 者 假设 下 ， 计 算 需 要 相 
同时 间 。 因 此 ， 按 照 01 和 02， 算 法 在 最 坏 情 况 下 的 行为 包括 在 定义 6.31 中 ， 是 时 间 复 杂 度 的 
下 界 。 

定理 6.38 回 波 算法 的 单位 时 间 复杂 度 为 O( 站 )。 回 波 算法 的 时 间 复杂 度 为 GUN)， 甚 至 在 
直径 为 1 的 网 络 中 。 

证 明 。 为 了 分 析 单位 时 间 复杂 度 ， 假 设 01 和 O02。 距 离 初始 进程 跳 数 路 离 为 4 的 进程 ， 在 
计算 开始 后 ， 恰 好 经 过 d 个 时 间 单位 接收 第 一 条 消息 <tok>。 在 所 得 的 树 7 中 的 深度 为 4。( 可 以 
对 4 用 归纳 法 证 明 这 一 点 。 ) 设 Dr 表 示 树 7 的 深度 ， 那 么 ，Dr< D。 并 且 树 7 中 深度 为 4 的 进程 ， 
最 迟 在 计算 开始 后 的 〈2Dr +1) -d 时 间 单位 向 其 父 节 点 发 送 消息 <tok>。( 可 对 d 用 向 后 归纳 证 
BY.) 由 此 可 得 ， 初 始 进程 最 迟 在 计算 开始 后 的 2Dr + 1 时 间 单位 进行 判定 。 

为 了 分 析 时 间 复 杂 度 ， 假 设 T1 和 T2。 与 初始 进程 相距 跳 数 为 4 的 进程 ， 在 计算 开始 后 ， 
最 迟 经 过 d 个 时 间 单 位 接收 第 一 条 消息 <tok>。( 可 以 对 d 用 归纳 法 证 明 这 一 点 . ) 假设 计算 开 
始 后 ，F 个 时 间 单 位 完成 生成 树 的 构造 ， 那 么 F < D。 生 成 树 的 深度 D; 不 必 受 网 络 直 径 所 限 
(在 以 下 的 计算 中 将 要 证 明 )。 但 是 因为 有 N 个 进程 ， 深 度 至 多 为 N-1。 对 于 树 7 中 深度 为 d 的 
进程 ， 最 迟 在 计算 开始 后 的 ( 忆 + 1) + (Dr -d) 时 间 单位 向 其 父 节点 发 送 消息 <tok>。( 可 对 
4 用 向 后 归纳 证 明 。) 由 此 可 得 ， 初 始 进程 最 迟 在 计算 开始 后 的 (F +1) + Dj 个 时 间 单位 判定 ， 
即 为 O(N)。 

为 证 明 Q(N) 为 时 间 复杂 度 的 下 界 ， 利 用 时 间 N， 构 造 了 N 个 进程 的 团 上 的 一 次 计算 。 在 
团 中 ,决定 一 棵 深度 为 N- 1 的 生成 树 (实际 上 是 节点 的 线性 链 )。 假 设 经 过 树 边 向 下 发 送 的 所 
有 消息 <tok> 在 发 送 的 UN 时 间 单 位 后 被 收 到 , 经 过 非 树 边 的 消息 <tok> 在 一 个 时 间 单位 后 收 到 。 
按照 假设 T2， 允 许 这 些 延迟 。 在 这 个 计算 中 ， 在 一 个 时 间 单位 内 构造 完全 树 ， 但 其 深度 为 N- 
1。 现 在 假设 经 过 树 边 向 上 发 送 的 所 有 消息 也 有 一 个 单位 时 间 的 延迟 ， 在 这 种 情况 下 ， 计 算 开 
始 后 恰好 N 个 单位 时 间 后 发 生 判 定 。 

也 许 有 人 会 问 ， 在 讨论 分 布 式 算法 的 时 间 复杂 度 时 ， 应 该 用 哪个 定义 。 单 位 时 间 复杂 
度 具 有 一 些 缺点 ， 没 有 考虑 某 些 计算 ， 尽 管 这 些 计算 在 算法 中 是 可 能 的 。 在 所 忽略 的 某 些 计 
算 中 ， 可 能 有 相当 一 些 计 算是 极其 耗 时 的 。 定 义 6.31 中 所 做 的 假设 并 不 排除 个 别 计算 。 在 定 
义 中 ,仅仅 定义 了 每 次 计算 的 时 间 度 量 。 时 间 复 杂 度 仍然 受到 由 计算 所 决定 结果 的 不 利 影 响 
(例如 定理 6.38 的 证 明 )， 尽 管 可 能 这 些 计算 被 认为 是 极 不 可 能 出 现 的 。 实 际 上 ， 在 这 个 计算 
中 ， 某 个 消息 可 能 被 NV-1 个 顺序 传输 的 消息 “ 绕 过 ”。 
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为 了 协调 这 两 种 定义 ， 还 可 以 考虑 a- 时 间 复 杂 度 ， 它 是 根据 每 个 消息 的 延迟 介 于 a 和 1 之 
间 (a 是 < 1 的 常数 ) 这 样 一 个 假设 确定 的 。 令 人 遗憾 的 是 ， 这 种 折 吏 具有 这 两 种 算法 的 缺点 。 
读者 可 能 自己 要 证 明 ， 回 波 算法 的 a- 时 间 复 杂 度 为 O( min(N，D/a))。 

如 果 假 设 了 消息 延迟 的 概率 分 布 ， 就 能 获得 最 准确 的 时 间 复 杂 度 的 度量 。 由 此 假设 ， 可 
以 计算 出 算法 的 期 望 计 算 时 间 。 这 种 方法 有 两 个 缺点 。 第 一 ， 算 法 分 析 太 依赖 于 系统 ， 因 为 
在 每 个 分 布 式 系统 中 ， 消 息 延 迟 的 分 布 不 同 。 第 二 ， 分 析 过 于 复杂 ， 在 大 多 数 情况 下 ， 不 能 
实现 。 

2. 基于 消息 链 的 定义 

可 以 利用 计算 的 结构 性 质 ， 而 不 是 理想 化 的 定时 假设 ， 来 定义 分 布 式 计算 的 时 间 消 耗 。 
设 C 是 一 次 计算 。 

定义 6.39 C 中 的 消息 链 是 一 个 消息 序列 m1，my，...，m ， 满 足 对 于 每 个 i,，0 < i < 大， 了 
的 接收 在 因果 关系 上 优先 于 miw1 的 发 送 。 

分 布 式 兽 法 的 链 时 复杂 度 定义 为 算法 中 任何 一 次 计算 的 最 长 消息 链 长 度 。 

. 如 同 定义 6.31， 这 个 定义 考虑 了 算法 执行 的 所 有 可 能 性 ， 来 定义 它 的 时 间 复 杂 度 ， 但 是 为 
计算 赋予 不 同 的 度量 。 考 虑 这 种 情况 (出 现在 定理 6.38 的 证 明 中 的 计算 )，k 个 消息 的 一 条 链 
绕 过 了 某 个 消息 。 这 个 ( 子 ) 计 算 的 时 间 复 杂 度 为 1 。 而 同样 的 ( 子 ) 计 算 ， 链 时 复杂 度 为 。 在 消 
息 延 迟 上 界 有 保证 的 (就 好 像 在 时 间 复 杂 度 定义 中 的 假设 ) 系 统 中 ， 时 间 复 杂 度 是 合适 的 度量 。 
而 在 “平均 ”延迟 后 大 多 数 消 息 才 被 传递 的 系统 中 ， 只 有 一 小 部 分 消息 可 能 有 较 大 的 延迟 ， 
此 时 ， 链 时 复杂 度 是 一 种 更 好 的 选择 。 


习题 


6.1 节 


6.1 给 出 具有 同步 消息 传递 系统 的 一 个 PIF 算 法 的 例子 ， 但 该 系统 不 能 计算 下 确 界 (与 定 
理 6.7 和 6.12 比 较 )。 你 的 例子 可 能 只 适合 于 某 种 特定 的 拓扑 结构 。 

6.2 ERË (X, <) 中 ， 称 元 素 有 为 底 ， 如 果 对 于 所 有 c EX, bse, 

它 被 用 于 定理 6.11 的 证 明 中 ， 偏 序 (X, <) 不 包含 底 。 底 在 哪儿 ? 

你 能 给 出 一 个 算法 ， 用 具有 底 的 偏 序 来 计算 下 确 界 吗 ? 且 该 算法 不 是 波动 算法 。 

6.3 ”给 出 两 个 自然 数 集 上 的 偏 序 ，(1) 其 中 一 个 其 下 确 界 函数 是 最 大 公 因 子 ，(2) 另 一 
个 其 下 确 界 画 数 是 最 小 公共 祖先 。 

给 出 全 集 U 的 子 集 集合 上 的 偏 序 ，(1) 其 中 一 个 其 下 确 界 画 数 是 集合 的 交 ， (2) 另 一 个 其 
下 确 界 函数 是 集合 的 并 。 

6.4 证 明 下 确 界 定理 (定理 6.13)。 


6.2 节 


6.5 证 明 在 树 网 算法 (图 6-3 所 示 的 算法 ) 的 每 次 计算 中 ， 只 有 两 个 进程 判定 。 

6.6 利用 回 波 算 法 (图 6-5 所 示 的 算法 )， 写 一 个 任意 网 上 计算 前 组 标号 模式 (4.4.3 小 节 ) 
的 算法 ， 利 用 21E| 条 消息 和 O(N) 个 时 间 单 位 。 

你 能 给 出 一 个 用 O(D) 的 时 间 计算 标号 模式 的 算法 吗 ? (DD 是 网 络 的 直径 , ) 
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6.7 证明， 如 果 在 信道 pg 中 消息 丢失 ， 引 理 6.19 中 的 关系 仍 成 立 ， 但 是 如 果 消 息 可 被 复 
制 ， 引 理 6.19 中 的 关系 不 成 立 。 如 果 消 息 可 复制 ， 证 明 中 的 那 一 步 是 失效 的 ? 
6.8 ”把 定理 6.12 的 构造 方法 应 用 到 相位 算法 中 ， 得 到 的 算法 可 以 计算 所 有 进程 输入 (4% 
数 ) 的 最 大 值 。 你 所 设计 的 算法 的 消息 复杂 度 、 时 间 复 杂 度 和 位 复杂 度 是 多 少 ? 
6.9 假设 你 想 将 波动 算法 用 于 其 中 可 能 出 现 消息 复制 的 网 络 中 。 
(1) 对 回 波 算法 要 做 哪些 修改 ?7 
(2) 对 Finn 算 法 要 做 哪些 修改 ? 
6.3 节 
6.10 完全 二 分 图 是 图 G = (V, E), 其 中 V= VU VABVINV, =Ø, E= Vi x Vo. 
给 出 一 个 完全 二 分 网 络 的 2x- 遍 历 算 法 。 
6.11 (A) 文献 [DRT98] 表 明 ， 在 没有 方向 俩 听 的 超 立 方 体 上 进行 遍历 和 广播 也 是 可 
能 的 。 算 法 是 广 遍 历 的 / 值 为 多 少 ? 
6.4 节 


6.12 给 出 Tarry 算 法 计算 的 一 个 例子 ， 所 得 的 树 7 不 是 一 棵 DFS 树 。 
6.13 ”对 于 一 个 任意 连通 网 络 ， 给 出 计算 深度 优先 搜索 区 间 标 号 模式 (4.4.2 小 节 ) 的 算 


它 可 在 O(N) 时 间 单 位 完成 吗 ? 可 用 O(N) 条 消息 来 完成 吗 ? 

6.14 假设 具有 近邻 知识 的 深度 优先 搜索 算法 用 于 系统 中 ， 系 统 中 每 个 进程 不 仅 知道 近 
” 邻 标 识 ， 而 且 知 道 所 有 进程 标识 集 (了 )。 证 明 每 个 进程 只 需 N 位 消息 即 可 。 225 
6.5 节 

6.15 修改 回 波 算法 (图 6-5 所 示 的 算法 )， 使 其 能 够 计算 进程 输入 和 。 

6.16 在 图 6-21 说 明 的 网 络 中 ， 假 设 进程 具有 惟一 标识 ， 每 个 进程 有 一 个 整数 输入 。 在 两 
个 网 络 上 ， 模 拟 相 位 算法 的 一 次 计算 ， 计 算 集合 5 ={ (p, j,): pEP}， 以 及 对 输入 求 和 。 

6.17 团 的 相位 算法 (图 6-8 所 示 的 算法 ) 的 链 时 复杂 度 是 多 少 ? 


nN 
N 
fon) 





第 7 章 选举 算法 


本 章 讨 论 选举 问题 ， 也 称 找 领导 人 问题 。LeLann[fLeL77] 首 先 提 出 了 选举 问题 ， 参 见 7.2.1 
小 节 。 和 问题 是 从 具有 同一 状态 的 进程 配置 开始 ， 最 后 达到 一 种 配置 状态 ， 其 中 只 有 一 个 进程 
处 于 leader 状 态 ， 而 其 他 所 有 进程 处 于 iost 状 态 。 

如 果 要 执行 集中 式 算 法 ， 且 没有 一 个 优先 的 候选 人 作为 算法 的 初始 进程 ， 就 要 举行 进程 
的 选举 。 例 如 ， 可 能 存在 这 样 一 种 情况 ， 初 始 进程 必须 在 初始 时 执行 或 者 在 系统 损毁 后 执行 。 
因为 预先 并 不 知道 活动 进程 集合 。 它 不 可 能 对 一 个 进程 指派 一 次 ， 也 不 能 对 所 有 进程 都 指派 
领导 人 的 角色 。 

现 有 大 量 关 于 选举 问题 (算法 以 及 更 一 般 的 理论 ) 的 成 果 存 在 。 本 章 的 内 容 按 照 以 下 崔 
则 选取 。 

(1) 同步 系统 、 匿 名 进程 和 容错 算法 在 其 他 章 讨 论 。 本 章 总 是 假设 ， 进 程 和 信道 是 可 靠 
的 ， 系 统 是 完全 异步 的 ， 以 惟一 标识 区 别 进 程 。 

(2) 比较 不 同 计算 模型 的 效率 ， 选 举 问题 起 着 “基准 问题 ”(benchmarking problem) 的 
作用 。 我 们 只 涉及 比较 中 所 需 的 一 些 结果 ， 在 后 面 的 章节 (9、12、11) 中 还 会 经 常 讨论 到 这 
个 问题 。 

(3) 本 章 集 中 讨论 消息 复杂 度 、 有 改进 的 时 间 复 杂 度 的 算法 。 没 有 讨论 在 时 间 复 杂 度 和 
消息 复杂 度 之 间 权 衡 后 所 得 到 的 结果 。 


7.1 引言 


选举 问题 要 求 ， 从 具有 相同 状态 的 进程 的 配置 开始 ， 达 到 一 种 配置 状态 ， 其 中 只 有 一 个 
进程 处 于 领导 人 状态 ， 而 其 他 所 有 进程 处 于 失败 状态 。 在 计算 的 最 后 ， 处 于 领导 人 状态 的 进 
程 称 为 领导 人 ， 它 由 算法 选 出 。 

定义 7.1 选举 算法 满足 以 下 性 质 的 。 

(1) 每 个 进程 有 相同 的 局 部 算法 。 

(2) 算法 是 分 散 式 的 ， 即 ， 进 程 的 任意 非 空子 集 都 能 开始 一 次 计算 。 

(3) 在 每 次 计算 中 ， 算 法 达到 终止 配置 。 在 每 一 个 可 达 的 终止 配置 中 ， 只 有 一 个 进程 处 
于 领导 人 状态 ， 而 其 他 所 有 进程 处 于 失败 状态 。 

最 后 一 个 性 质 有 时 可 以 弱化 ， 只 要 求 有 一 个 进程 处 于 领导 人 状态 。 然 而 也 有 这 种 情况 ， 
被 选 进程 得 知 它 已 赢得 选举 ， 而 失败 进程 还 未 意识 到 它们 的 失败 。 如 果 一 个 算法 满足 这 个 给 
定 的 弱 要 求 条 件 ， 就 很 容易 由 领导 人 开始 一 个 扩散 过 程 ， 并 通知 所 有 进程 选举 结果 。 本 章 的 
一 些 算法 省 略 了 这 个 通知 。 

本 章 的 所 有 算法 中 ， 进 程 p 有 变量 state。， 其 可 能 的 值 包 括 leader 和 lost。 有 时 假设 在 p 执 行 
算法 的 任何 步 之 前 ，state, 的 值 为 sleep。 如 果 p 已 经 参加 计算 ,但 还 不 知道 它 是 否 赢得 选举 ， 


则 设 stares 的 值 为 cand。 有 些 算法 还 用 另外 一 些 状态 ， 如 活动 的 (active)、 被 动 的 (passive) * 


等 状态 。 这 些 将 会 在 算法 中 表明 。 
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7.1.1 本 章 所 做 假设 


我 们 现在 回顾 一 下 本 章 研究 的 选举 问题 。 

(1) 系统 是 完全 异步 的 假设 进程 不 能 访问 公共 时 钟 ， 消 息 传 输 时 间 可 任意 长 短 。 

由 此 可 得 这 样 一 个 假设 : 同步 消息 传递 ( 即 ， 认 为 消息 的 发 送 和 接收 是 一 次 转移 ) 几乎 
不 会 影响 选举 问题 所 获得 的 结果 。 读 者 自己 可 以 确信 ， 本 章 给 出 的 算法 可 用 于 具有 同步 消息 
传递 的 系统 ， 所 得 结果 下 界 也 适用 于 这 种 情况 。 

全 局 定时 假设 对 选举 问题 的 解决 方法 具有 重要 影响 。 例 如 ， 假 设 进程 可 观察 到 真实 时 间 
而 且 消 息 延 迟 有 限 。 

(2) 每 个 进程 具有 惟一 标识 其 标识 初始 时 对 于 进程 是 可 知 的 ”为 简单 起 见 ， 假 设 进程 p 的 
标识 就 是 p， 标 识 可 从 全 序 集 万 中 取出 ， 即 ， 标 识 上 的 关系 《可 用 。w 表 示 一 个 标识 的 位 数 。 

在 选举 问题 中 ， 标 识 的 惟一 性 是 非常 重要 的 。 不 仅 可 用 来 对 消息 定 址 ， 也 可 用 于 打破 进 
程 之 间 的 对 称 性 。 但 设计 选举 算法 时 ， 可 能 假定 具有 最 小 (或 最 大 ) 标识 的 进程 赢得 选举 。 
那么 ， 问 题 就 变 成 了 用 分 散 式 算法 找 最 小 标识 的 问题 。 在 这 种 情况 下 ， 称 选举 问题 为 找 极 值 
(extrema-finding ) 问题 。 

尽管 本 章 所 讨论 的 某 些 算法 ， 最 初 是 为 选 出 最 大 进程 而 进行 形式 化 的 ， 但 实际 上 ， 我 们 
将 大 多 数 这 样 的 算法 形式 化 为 选取 最 小 进程 的 问题 。 我 们 可 以 通过 将 两 个 标识 之 间 的 比较 次 
序 颠 倒 过 来 ， 得 到 最 大 进程 的 选举 算法 。 

(3) 本 章 中 与 比较 算法 有 关 的 一 些 结果 ”比较 算法 就 是 利用 比较 作为 对 标识 的 惟一 操作 
的 算法 。 通 过 对 算法 进行 检查 ， 可 以 看 出 ， 本 章 所 有 算法 都 是 比较 算法 。 当 给 出 一 个 下 界 结 
果 时 ， 我 们 会 详细 地 阐明 它 是 否 与 比较 算法 有 关 。 

可 以 证 明 (例如 ， 按 Bodlaender [Bod91b] 针 对 环 网 络 的 情况 )， 异 步 网 络 中 ， 任 意 算 法 不 
会 比比 较 算 法 有 更 好 的 复杂 度 。 与 第 12 章 中 将 要 讨论 的 同步 系统 情况 不 同 。 在 这 些 同步 系统 
中 ， 任 意 算法 会 达到 比比 较 算法 更 好 的 复杂 度 。 

(4) 每 条 消 息 可 能 包含 DO(w) 位 “每 条 消息 最 多 只 可 包含 固定 数目 的 进程 标识 。 这 样 做 的 
目的 是 ， 可 以 公平 地 比较 不 同 算法 的 通信 复杂 度 。 


7.1.2 ”选举 和 波动 


如 前 所 述 ， 进 程 标识 可 以 用 来 打破 进程 之 间 的 对 称 性 。 可 以 这 样 设计 算法 ， 使 得 具有 最 
小 标识 的 进程 就 是 所 选举 的 进程 。 按 照 6.1.5 小 节 的 结果 ， 在 一 次 波动 中 ， 进 程 可 以 计算 出 最 
小 标识 。 这 表明 可 以 执行 计算 最 小 标识 的 一 次 波动 来 举行 选举 。 执 行 之 后 ， 具 有 这 个 标识 的 
进程 就 成 为 领导 人 。 由 于 选举 算法 必须 是 分 散 式 的 ， 这 个 原理 只 能 用 于 分 散 式 的 波动 算法 
(参见 表 6-1)。 

1. 基于 树 算法 的 选举 

如 果 网 络 的 拓扑 结构 是 树 ,或 者 网 络 的 生成 树 可 用 ， 可 以 使 用 树 算法 进行 选举 (6.2.2 节 )。 
在 树 算法 中 ， 要 求 至 少 所 有 叶子 节点 是 算法 的 初始 进程 。 为 使 算法 进行 ， 以 免 算法 中 只 有 部 
分 进程 是 初始 进程 ， 我 们 加 入 唤醒 (wake-up) 阶段 。 想 要 开始 选举 的 进程 将 消息 <wakeup> 
扩散 到 所 有 进程 中 。 布 尔 变量 ws 用 于 使 每 个 进程 至 多 发 送 一 次 消息 。 变 量 wr 用 于 对 进程 接收 
的 消息 <wakeup> 计 数 。 当 进程 通过 每 个 信道 接收 到 消息 <wakeup> 时 ， 就 开始 执行 图 6-3 所 示 
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的 算法 ,可 以 扩充 图 6-3 所 示 的 算法 (正如 定理 6.12 中 所 作 的 那样 ), 使 其 进行 最 小 标识 的 计算 。 
并 使 得 每 个 进程 判定 。 当 进程 进行 判定 时 ， 就 知道 了 领导 人 的 标识 。 如 果 该 标识 与 进程 标识 
相等 ， 它 就 称 为 领导 人 ， 否 则 就 成 为 失败 进程 (参见 图 7-1 所 示 的 算法 )。 


: boolean init false ; 
: integer init 0 ; 
: boolean for each q € Neigh, init false ; 


: init p ; 
: (sleep, leader, lost) init sleep ; 


begin if p is initiator then 
begin ws, := true ; 
forall q € Neigh, do send (wakeup) to q 
end ; 
while wr, < # Neigh, do 
begin receive (wakeup) ; wrp := wrp + 1 ; 
if not ws, then 
begin wsp := true ; 
forall q € Neigh, do send ( wakeup) to g 
end 
end ; 
(* Now start the tree algorithm *) 
while #{q : -recplgl} > 1 do 
begin receive (tok, r) from q ; recpfg] := true ; 
Up := min(vp, r) 
end ; 
send (tok, vp) to go with -recp[ao] ; 
receive (tok,r) from go ; 
Up := min(vp, r) ; (* decide with answer vp *) 
if up = p then state, := leader else state, := lost ; 
forall q € Neigh,, q # qo do send (tok, vp) to q 





图 7-1 基于 树 的 选举 算法 

定理 7.2 基于 树 的 选举 (图 7-1 所 示 的 算法 ) 的 消息 复杂 度 为 O(N)， 时 间 复 杂 度 为 
O(D). 

证 明 。 至 少 有 一 个 进程 开始 执行 算法 ， 所 有 进程 向 各 自 所 有 近邻 发 送 消息 <wakeup>， 每 
个 进程 在 接 到 来 自 每 个 近邻 的 消息 <wakeup> 之 后 ， 开始 执行 树 网 选举 算法 。 所 有 进程 以 同一 
个 值 " 终 止 该 算法 。 即 ， 进 程 的 最 小 标识 。 具有 这 个 标识 的 (惟一 ) 进 程 结束 时 处 于 领导 人 状态 。 
其 他 进程 结束 时 处 于 失败 状态 。 

经 过 每 个 信道 发 送 两 条 消息 <wakeup> 和 两 条 消息 <tok ，r> ， 这 使 得 消息 复杂 度 为 4N-4。 
第 一 个 进程 开始 执行 算法 后 的 D 个 时 间 单 位 内 ， 每 个 进程 发 送 了 消息 <wakeup>， 因 此 ,在 
D+i 个 时 间 单 位 内 ， 每 个 进程 开始 波动 。 显 而 易 见 ， 第 一 次 判定 发 生 在 波动 开始 后 的 D 个 时 
间 单 位 内 ， 最 后 一 次 判定 发 生 在 第 一 次 判定 后 的 D 个 时 间 单 位 内 ， 这 使 得 总 时 间 为 3D+1。 更 
细致 的 算法 分 析 揭 示 算法 总 是 在 2D 个 时 间 单 位 内 终止 ， 这 留 给 读者 去 论证 ， 参见 习题 7.2。 

口 
如 果 消 息 在 信道 中 重新 排列 序列 ( 即 信道 不 是 fifo)， 进程 可 能 从 近邻 接收 消息 <tok r>, 
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而 此 时 它 还 没有 接 到 这 个 近邻 进程 的 消息 <wakeup>。 在 这 种 情况 下 ， 可 将 消息 <tok，r> 和 暂时 
存储 ， 或 者 将 它 作为 随后 到 达 的 消息 <tok, r> 处 理 。 

通过 两 个 修正 可 以 减少 消息 数 。 第 一 ， 可 以 排列 ， 使 得 非 初 始 进程 并 不 向 它 第 一 次 接 到 
消息 <wakeup> 的 进程 发 送 消息 <wakeup>。 第 二 ， 可 将 叶 节 点 发 送 的 消息 <wakeup> 与 该 叶 节 
点 发 送 的 消息 <tok ，r> 组 合 。 做 了 这 些 修正 ， 算 法 中 所 要 求 的 消息 数 可 减少 到 3N-4+k， 其 中 
k 是 非 叶 初始 进程 个 数 [Tel91b，p.139]。 

2. 基于 相位 的 选举 算法 

相位 算法 可 用 来 解决 选举 问题 ， 方 法 是 通过 在 一 次 波动 中 计算 最 小 标识 ， 见 定理 6.12。 

定理 7.3 在 任意 网 上 用 相位 算法 (图 6-7 所 示 的 算法 ) 解 选 举 问题 ， 消 息 复 杂 度 为 
O(D :15D， 利 用 O(CD) 个 时 间 单 位 。 

Peleg 算 法 [Pe190] 基 于 相位 算法 。 利 用 O(D : IE1) 条 消息 和 O(D) 个 时 间 单 位 。 但 不 需要 
知识 D， 因 为 算法 中 包括 直径 的 在 线 计算 。 

3. 基于 Finn 算 法 的 选举 

Finn 算 法 (图 6-9 所 示 的 算法 ) 并 不 要 求 预 先知 道 网 络 直 径 。Finn 算 法 所 用 的 O(N - IE!) 
条 消息 要 比 本 章 所 做 的 假设 要 长 ， 因 此 ，Finn 算 法 的 每 条 消息 总 计 有 O(N) 条 消息 ， 这 使 得 
消息 复杂 度 达到 O(N? - IE). 


7.2 环 网 


本 节 考 虑 单 向 环 上 的 选举 算法 。LeLann[LeL77] 首 先 提 出 了 环 网 上 的 选举 问题 ， 同 时 给 出 
了 消息 复杂 度 为 O( 和 NV?) 的 解决 方法 。Chang 和 Roberts[CR79] 改进 了 这 个 算法 。 给 出 了 算法 最 
坏 情 况 下 的 复杂 度 O( NV?)。 但 算法 的 平均 复杂 度 仅 为 O(N log N)。 在 7.2.1 讨 论 了 LeLann 和 
Chang-Roberts 的 方法 。 直 到 1980 年 ，Hirschberg 和 Sinclair[HS80] 给 出 了 最 坏 情 况 下 复杂 度 为 
O(N log N) 的 选举 算法 。 与 早先 的 一 些 算法 不 同 ，Hirschberg-Sinclair 算 法 要 求 信道 是 双向 的 。 
暂且 推测 ，Q(N?) 的 消息 复杂 度 是 单 向 环 的 下 界 。 但 是 Petersen[Pet82] 和 Dolev、Klawe 及 
Rodeh[DKR82] 各 自 独立 地 提出 了 单 向 环 上 复杂 度 为 O(N log N) 的 解决 方法 。 这 些 方法 在 
7.2.2 小 节 讨 论 。 

通过 匹配 大 约 相同 时 间 的 下 界 ， 可 以 对 算法 进行 补充 。Bodlaender[Bod88] 证 明了 双向 环 
上 最 坏 情 况 下 消息 复杂 度 的 一 个 下 界 ， 约 为 0.34 N log N. Pachi, Korach 和 Rotem[PKR84] 证 
明了 平均 情况 下 消息 复杂 度 的 一 个 下 界 Q(N log N)， 对 于 双向 和 单 向 环 都 成 立 。 在 7.2.3 节 将 
讨论 下 界 的 结果 。 


7.2.1 LeLann 和 Chang-Roberts 算 法 


在 LeLann[LeL77] 算 法 中 ， 每 个 初始 进程 计算 所 有 初始 进程 的 标识 表 。 计 算 之 后 ， 具 有 最 
小 标识 的 进程 被 选中 。 通 过 环 网 ， 每 个 初始 进程 发 送 一 个 包括 它 自己 标识 的 令 牌 这 个 令 牌 
被 所 有 进程 转发 。 假 设 信道 是 fifo 的 ， 某 个 初始 进程 必须 在 其 他 初始 进程 接 到 令 牌 之 前 ， 产 生 
它 的 令 牌 。( 当 进 程 接 到 令 牌 时 ， 它 以 后 再 不 会 初始 算法 。) 当初 始 进程 p 接 到 它 自 己 的 返回 令 
牌 ， 所 有 初始 进程 的 令 牌 都 已 经 过 p，p 当 选 ， 当 且 仅 当 p 是 初始 进程 中 的 最 小 的 。 参 见 图 7-2 
所 示 的 算法 。 


定理 7.4 LeLann 选 举 算 法 (图 7-2 所 示 的 算法 ) 解 决 环 网 的 选举 问题 ， 消 息 复杂 度 为 
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OUNM )， 利 用 OUN) 个 时 间 单 位 。 

证 明 。 因 为 在 环 上 令 牌 的 次 序 保持 不 变 〈 由 fifo 假 设 )， 和 初始 进程 q 在 q 接 到 消息 <tok，、p> 
之 前 ， 发 送出 消息 <tok，4>。 初 始 进程 p 在 p 接 到 返回 消息 <tok，p> 之 前 接 到 消息 <tok，4q>。 
由 此 可 得 ， 每 个 初始 进程 p 以 List, 结 束 ，List, 等 于 所 有 初始 进程 的 集合 。 具 有 最 小 标识 的 初始 
进程 是 当选 的 惟一 进程 。 至 多 有 NN 个 不 同 令 牌 ， 每 个 进行 N 步 ， 这 使 得 消息 复杂 度 达到 O(N?)。 
在 第 一 个 初始 进程 发 送出 令 牌 后 最 迟 N-1 个 时 间 单 位 ， 每 个 初始 进程 也 已 经 发 送 完成 ， 且 在 
那个 令 牌 产 生 后 的 N 个 时 间 单 位 内 ， 每 个 初始 进程 接 到 返回 的 令 牌 。 这 蕴含 着 ， 算 法 在 2N-1 
个 时 间 单 位 内 终止 。 














Var 了 istp : set fP init {p}; 
statep ; 


begin if p is initiator then 
begin state, := cand ; send (tok, p) to Next, ; receive (tok, q) ; 
while q Æ p do 
begin List, := List, U {q} ; 
send (tok, q) to Nezt, ; receive (tok, q) 
end ; 


if p = min(Listp) then statep := leader 
else state, := lost 


end 
else while true do 
begin receive (tok,q) ; send (tok,q) to Next, ; 
if state, = sleep then state, := lost 
end 





图 7-2 Lelann 选 举 算法 


非 初 始 进程 都 进入 失败 状态 ， 但 是 仍然 等 待 更 多 消息 <tok，r>。 如 果 领 导 人 沿 着 环 发 出 
一 个 特殊 令 牌 ， 宣 告 选举 已 经 结束 ， 那 么 等 待 才能 中 止 。 

Chang-Roberts 算 法 [CR79] 改 进 了 LeLann 算 法 ， 从 环 中 删除 了 所 有 那些 看 起 来 将 失去 选举 
的 进程 的 令 牌 。 即 ， 如 果 q > p， 则 初始 进程 p 从 环 中 删除 令 牌 <tok，g>。 当 初始 进程 p 接 到 令 
牌 9， 且 其 标识 满足 9 < p 时 ， 初 始 进程 p 变 成 失败 进程 。 当 进程 接 到 标识 为 p 的 令 牌 时 ， 就 变 成 
领导 人 。 参 见 图 7-3 所 示 的 算法 。 

定理 7.5 Chang-Roberts 算 法 (图 7-3 所 示 的 算法 ) 解决 了 环 网 的 选举 问题 ， 最 坏 情况 下 
的 消息 复杂 度 为 BG(N2)， 利 用 O(N) 个 时 间 单 位 。 

证 明 。 设 po 是 具有 最 小 标识 的 初始 进程 。 每 个 进程 或 者 是 非 初始 进程 ， 或 者 是 标识 大 于 po 
的 初始 进程 ， 所 有 进程 转发 由 Po 所 发 送 的 令 牌 <tok ，po>。 因 此 ，po 接 到 返回 的 令 牌 ， 并 当选 。 

非 初 始 进程 没有 当选 ， 而 是 都 进入 失败 状态 ， 最 迟 在 po 的 令 牌 被 转发 时 。p > po 的 初始 进 
程 p 也 没有 当选 ，po 并 不 转发 令 牌 <tok，p>， 因 此 ， 进 程 p 永 远 接收 不 到 自己 的 令 牌 。 这 样 的 
初始 进程 p， 最 迟 在 <tok ，po> 被 转发 时 进入 失败 状态 。 这 就 证 明了 算法 解决 了 选举 问题 。 

至 多 使 用 N 个 不 同 的 令 牌 ,每 个 令 牌 至 多 被 转发 N 个 跳 数 ， 这 就 证 明了 消息 复杂 度 的 界限 
HON). AUEWBDAAQ(N?) 条 消息 ， 考 虑 初始 配置 ， 其 中 标识 沿 环 上 的 递增 次 序 排列 
(参考 图 7-4)。 每 个 进程 都 是 一 个 初始 进程 。 进程 0 可 以 从 环 上 删除 每 个 进程 的 令 牌 。 因 此 进 
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程 : 的 令 牌 被 转发 N-i 个 中 数 。 这 使 得 消息 传递 数 达到 Y (N-D = 1/2N(N +1) 。 g 


var statep ; 


begin if p is initiator then 
begin state, := cand ; send (tok, p) to Neztp ; 
while state, # leader do 
begin receive (tok, q) ; 
if q = p then state, := leader 
else if q < p then 
begin if state, = cand then state, := lost ; 


send (tok,q) to Nezt, 
end 
end 
end 

else while true do 

begin receive (tok, q) ; send (tok,q) to Nezt, ; 
if state, = sleep then state, := lost 
end 
end 


C 只 有 领导 人 终止 这 个 程序 。 它 将 消息 分 散 到 所 有 进程 中 ， 告 知 它们 领导 人 的 标识 ， 并 终止 。* ) 





图 7-3 Chang-Roberts 选 举 算法 


顺 时 针 方向 传递 消息 


i 
235 图 7-4 Chang-Roberts 算 法 的 最 坏 情况 
当 考 虑 时 间 复 杂 度 或 最 坏 情 况 消息 复杂 度 时 ，Chang-Roberts 算 法 不 再 是 对 LeLann 算 法 的 
改进 。 而 如 果 考 虑 平均 情况 ， 则 是 一 种 改进 。 平 均 是 指标 识 在 环 上 所 有 可 能 的 排列 。 


P2 PN-1 


P3 顺 时 针 方 向 传递 消息 


图 7-5 环 上 标识 排列 


定理 7.6 SOA MAA MAH, Chang-Roberts 算 法 平均 情况 下 只 要 求 O(N log N) 
次 消 息 传递 。 
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证 明 。( 这 个 证 明基 于 Friedemann Mattern 的 提示 ) 
假设 所 有 进程 都 是 初始 进程 ， 我 们 计算 令 牌 在 N 个 不 同 标 识 组 成 的 所 有 环形 排列 上 ， 令 牌 
传递 的 平均 数 。 考 虑 N 个 标识 的 固定 集合 ， 设 * 是 最 小 标识 。 有 (N=-1) 1! 个 标识 的 不 同 环形 排 
列 。 在 给 定 的 环形 排列 中 ， 设 P 是 在 之 前 出 现 ; 步 的 标识 ， 参 见 图 7-5。 
要 计算 所 有 排列 上 所 传递 的 令 牌 总 数 ， 首 先 计算 在 所 有 排列 上 传递 令 牌 <tok ，P> 的 总 次 
数 ， 然 后 对 i 求 和 。 在 每 个 排列 中 ， 传 递 令 牌 <tok，s> N 次 ， 因 此 共 传 递 N(N-1)! 次 。 至 多 传 
递 令 牌 <toek，pi> 次 。 因 为 如 果 它 到 达 *， 就 会 被 从 环 上 删除 。 设 4 是 令 牌 <tok ，PP> 只 被 传递 
K 次 的 环形 排列 数 。 则 令 牌 <tok ，pi> 被 传递 的 总 次 数 为 Sk Ag) 。 
如 果 P 是 标识 p 到 p 的 最 小 标识 ， 则 令 牌 <tok ，P> 只 被 传递 次 ， 这 是 排列 数 为 (LU D- (N-1)! 
次 的 情况 。 因 此 ， 
A =7(N-D)! 
如 果 进 程 PP 后 有 上 -1 个 进程 的 标识 大 于 户 ， 则 令 牌 <tok ，P> 至 少 被 传递 次 (k<i), YR, 
Pi 是 k 个 标识 pi-wt，…，p; 中 最 小 标识 的 排列 数 为 所 有 排列 的 Vk， 即 ，(1/KR) : (N-1) !。 现 在 ， 
对 于 k < i， 如 果 令 牌 <tok，p 关 > 恰恰 传递 次 ， 且 不 多 于 Kk 次 ， 即 ， 至 少 传递 k 次 但 不 是 至 少 传递 
Kk+1 次 、 则 令 牌 恰好 传递 次 。 因 此 这 种 情况 发 生 时 ， 排 列 数 为 
1 1 
iN - Dis N-D! 
即 ， 
rr (对 于 k <i) 


在 所 有 排列 中 ， 传 递 令 牌 <tok ，p> 的 总 次 数 为 


San) +i=(N-1) 


它 等 于 ( Sin 1/k) (N-1) !。 称 和 ( Sa 1/k ) 为 第 i 个 调和 数 (harmonic number), 
用 H 表 示 。 以 下 等 式 的 证 明 ， 留 做 习题 7.3。 


2u =(m+1)H„-m 


接 下 来 对 ; 求 和 计算 所 传递 的 令 牌 数 ， 得 到 所 有 排列 中 令 牌 传递 的 总 数 (除了 那些 <tok， 
5> 的 传递 )。 总 数 为 


N-] 

> HAN -1)!]=(NH,., -(N- DXN -1)! 
加 上 传递 令 牌 <tok，s> 的 次 数 N .(N-1)!， 可 得 令 牌 传递 的 总 数 为 

(NH +1I(N-D!=(NH,)(N-D! 


因为 这 是 对 于 (N-1)! 个 不 同 排列 ， 因 此 平均 传递 次 数 显 然 为 NHw， 约 为 0.69N log N (参见 
习题 7.4)。 o 
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7.2.2 Peterson/Dolev-Klawe-Rodeh 算 法 


Chang-Roberts 算 法 平均 情况 下 的 消息 复杂 度 为 O(NiogN)。 但 不 是 最 坏 情况 。 
Franklin[Fra82] 给 出 了 最 坏 情 况 下 的 消息 复杂 度 为 O(NlogN) 的 算法 。 在 算法 中 ， 要 求 信道 是 
双向 的 。Peterson[Pet82] 和 Dolev、Klawe 和 Rodeh[DKR82] 分 别 独立 地 研究 出 了 类 似 算法 ， 解 
决 了 问题 ， 单 向 环 上 最 坏 情 况 下 消息 复杂 度 为 O(N log N)。 算 法 要 求 信 道 是 fifo 的 。 

算法 首先 计算 最 小 标识 ， 并 使 它 为 每 一 进程 所 知 。 具 有 该 标识 的 那个 进程 变 成 领导 人 ， 
其 他 进程 都 被 击败 。 如 果 把 算法 的 执行 看 作 是 标识 的 执行 ， 而 不 是 进程 的 执行 ， 算 法 就 会 
更 容易 理解 。 初 始 时 ， 每 个 标识 是 活动 的 ， 在 每 一 轮 以 后 ， 有 一 些 标识 变 成 被 动 的 ， 如 稍 
后 所 示 。 在 一 轮 中 、 一 个 活动 标识 和 与 它 相 邻 的 两 个 活动 标识 (一 个 在 顺 时 针 方 向 ， 一 -个 
在 逆 时 针 方 向 ) 进行 比较 ， 如 果 它 是 局 部 最 小 ， 则 它 在 那 一 轮 中 生存 下 来 ， 否 则 ， 就 变 成 
被 动 的 。 因 为 所 有 标识 不 同 ， 与 局 部 最 小 相 邻 的 标识 不 是 局 部 最 小 ， 这 蕴含 着 ， 一 轮 中 至 
少 有 一 半 的 标识 不 会 生存 下 来 。 因 此 ， 至 多 log N 轮 后 ， 只 剩 下 一 个 活动 标识 。 它 就 是 获胜 
者 。 

在 双向 网 络 中 ,可 用 直接 方式 详细 描述 这 个 原理 ， 正 像 Franklin 算 法 [Fra82] 中 所 做 的 那样 。 
在 有 向 环 中 ， 消 息 只 能 按照 顺 时 针 方 向 发 送 ， 这 使 得 它 在 顺 时 针 方向 难以 获得 下 一 个 活动 标 
识 ， 参见 图 7-6。 标 识 q 必 须 与 -和 p 进 行 比较 ， 标 识 r 可 被 发 送 到 g， 但 是 标识 p 必 须 沿 信道 的 反 
方向 侦 历 ， 才 能 到 达 q。 为 了 能 与 r 和 p 进 行 比较 ， 标 识 q 被 发 送 (在 环 的 方向 ) 到 持 有 标识 p 的 
进程 中 ，r 不 仅 被 转发 到 持 有 4 的 进程 中 ， 而 且 进 一 步 被 转发 到 持 有 p 的 进程 中 。 如 果 4 是 在 那 
轮 开 始 的 惟一 活动 进程 ， 则 4 在 遍历 中 遇 到 的 第 一 个 标识 等 于 g ( 即 ， 在 这 种 情况 下 ， Pp=q). 
当 出 现 这 种 情况 时 ， 该 标识 就 是 选举 中 的 获胜 者 。 


r q 
© 活动 进程 
O DiR 
p 


图 7-6 进程 获得 当前 9 和 /的 标识 


图 7-7 所 示 的 算法 给 出 了 单 向 环 上 的 进程 算法 。 称 进程 p 在 一 轮 中 是 活动 的 ， 如 果 在 该 轮 
的 一 开始 ， 它 持 有 活动 标识 ci, 。 否 则 ，p 是 被 动 的 ， 并 简单 地 传递 所 有 它 所 接收 的 消息 。 活 动 
进程 把 它 的 当前 标识 发 送 到 下 一 个 活动 进程 ， 并 利用 消息 <one， .> 获得 前 一 个 活动 进程 的 当 
前 标识 。 将 接收 的 标识 存储 在 变量 acn, 中 。 如 果 标 识 在 这 轮 中 幸存 下 来 ， 它 将 是 下 一 轮 中 p 的 
当前 标识 。 为 决定 是 否 标识 ccw 在 这 轮 中 幸存 下 来 ， 就 要 将 它 与 ci, 和 消息 <two，.> 中 所 得 到 
的 活动 标识 比较 。 进 程 p 发 送 消 息 <two，、acn,>， 使 得 在 下 一 个 活动 进程 中 做 出 决策 成 为 可 能 。 
当 acm = cz 时 ， 出 现 例外 。 在 这 种 情况 下 ， 该 标识 是 惟一 剩 下 的 活动 标识 ， 并 在 消息 <smal， 
acnp> 中 ， 向 所 有 进程 发 布 。 

定理 7.7 图 7-7 所 示 的 算法 解决 单 向 环 上 的 选举 问题 ， 消息 复杂 度 为 O(N log N). 

证 明 。 如 果 进 程 第 ;次 执行 主 循环 ， 则 称 它 是 在 第 ; 轮 中 。 轮 并 不 是 全 局 同步 的 ; 在 环 的 不 
同 部 分 ， 一 个 进程 可 能 在 另 一 个 进程 的 前 几 轮 。 但 是 ， 在 每 一 轮 中 ， 由 于 每 个 进程 只 能 发 送 
和 接收 两 条 消息 ， 且 信道 是 fifo 的 ， 因此 消息 的 接收 和 发 送 总 是 在 同一 轮 中 。 在 第 一 轮 中 ， 所 
有 初始 进程 都 是 活动 的 ， 每 个 活动 进程 持 有 不 同 的 “当前 标识 ”。 
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var cip :Pp init pi (* Current identity of p *) 
acnp : P init udef; (* Id of anticlockwise active neighbor *) 
wing: P init udef; (* Id of winner *) 
statep: (active, passive, leader, lost) init active ; 


begin if p is initiator then state, := active else state, := passive ; 
while win, = udef do 
begin if state, = active then 
begin send (one, ci, ) ; receive (one,q) ; acnp := q ; 
if acn, = cip then (* acnp is the minimum *) 
begin send (smal, acnp ) ; wing := acny ; 
receive (smal, q) 
end 
else (* acnp is current id of neighbor *) 
begin send (two, acn, ) ; receive {two,q) ; 
if acnp < cip and acny < q 
then ci, := acnp 
else state, := passive 
end 
end 
else (* state, = passive *) 
begin receive (one, q) ; send (one, q) ; 
receive m ; send m ; 
(* m is either (two, q) or (smal, q) *) 
if m is a (smal, q) message then Winy := q 
end 
end ; 
a if p = win, then state, := leader else state, := lost 
en 





图 7-7 Peterson/Dolev-Klawe-Rodeh@ 7: 


声明 7.8 如果 在 第 i 轮 开始 ， 有 k > 1 个 活动 进程 ， 每 个 进程 特有 不 同 的 cl， 那么 ， 在 那 一 
轮 中 ， 至 少 有 一 个 进程 幸存 ， 至 多 有 Kk/2 个 进程 幸存 。 并 且 在 那 一 轮 执 行 完 后 ， 所 有 活动 进程 
的 当前 标识 不 同 ， 且 这 些 标识 中 包括 最 小 标识 。 

证 明 。 通 过 交换 由 苓 动 进程 进行 传递 的 消息 <one，q>。 每 个 活动 进程 得 到 它 逆 时 针 方 向 
的 第 一 个 活动 近邻 的 当前 标识 ， 这 个 标识 在 任何 情况 下 都 不 会 和 自身 的 标识 相同 。 因 此 ， 每 
个 活动 进程 通过 消息 <two ，g> 的 交换 继续 那 一 轮 的 执行 ， 通 过 交换 ， 每 个 活动 进程 还 得 到 它 
着 时 针 方 向 第 二 个 活动 近邻 的 当前 标识 。 每 个 活动 进程 现在 持 有 不 同 的 acn 值 ， 这 蕴含 ， 那 一 
轮 中 的 所 有 幸存 者 ， 在 那 一 轮 结束 时 具有 不 同 标识 。 至 少 在 那 一 轮 开 始 时 具有 最 小 标识 的 进 
程 会 幸存 下 来 ， 因 此 至 少 有 -一 个 幸存 者 。 与 局 部 最 小 相 邻 的 标识 不 是 局 部 最 小 标识 ， 这 蕴含 
着 幸存 者 的 数目 至 多 为 b/2。 

声明 7.8 表 明 ， 将 会 存在 一 轮 ， 轮 数 < [log Nj +1， 开 始 时 只 有 一 个 活动 标识 ， 即 初始 进程 
的 最 小 标识 。 

声明 7.9 “如果 半 一 轮 开 始 时 ， 只 有 一 个 活动 进程 p， 且 当 前 标识 为 cz。 在 那 一 轮 以 后 ， 
算法 终止 ， 且 对 于 每 个 进程 9， win, = Ci, 。 

证 明 。 所 有 进程 传递 的 p 的 消息 <one，ci,>， 最 终 由 p 接 收 。 进程 p 获 得 acn = ci, AUF 
环 发 送 消 息 <smal，acn,>， 这 引起 每 个 进程 gq 在 win, = acn, 时 ， 退 出 主 循环 。 口 
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每 个 进程 中 算法 终止 ， 所 有 进程 对 领导 人 标识 (在 变量 wins 中 ) 取得 一 致 ， 这 个 进程 处 于 
领导 人 状态 ， 所 有 其 他 进程 处 于 失败 状态 。 

至 多 有 llog N| +1 轮 ， 每 一 轮 只 被 2N 个 消息 交换 ， 这 就 证 明 消 息 复杂 度 的 界限 为 2N log N 
+ O(N)。 这 就 证 明了 定理 7.7。 

Dolev 等 人 将 该 算法 改进 到 1.5 N log N。 此 后 Peterson 发 现 了 只 用 1.44 N log N 条 消息 的 算 
法 ， 这 个 结果 再 次 被 Dolev 等 人 改进 到 1.356 N log N。 环 上 选举 问题 的 上 限 1.356 N log N， 保 
持 了 10 年 以 上 的 最 好 结果 ， 在 1993 年 被 Higham 和 Przytycka[HP93] 改 进 到 1.271 N log N。 


7.2.3 一 个 下 界 


在 本 小 节 中 ,证 明了 单 向 环 上 选举 复杂 度 的 一 个 下 界 。 因 为 可 以 在 分 散 式 波动 算法 的 一 
次 执行 中 举行 选举 ， 因 而 ， 作 为 推论 ， 可 得 环 上 分 散 式 波 动 算 法 复杂 度 的 下 界 。 

在 下 列 假设 下 ，Pachl、Korach 和 Rotem[PKR84] 给 出 了 上 述 结果 。 

(1) 证 明了 计算 最 小 标识 算法 的 下 界 。 如 果 领 导 人 可 用 ， 那 么 在 N 条 消息 中 ， 可 以 计算 出 
最 小 标识 。 如 果 至 少 一 个 进程 知道 最 小 标识 ， 那 么 具有 这 个 标识 的 进程 在 N 条 消息 中 当选 。 因 
此 ， 选 举 问 题 和 计算 最 小 标识 问题 在 复杂 度 上 至 多 相差 N 条 消息 。 

(2) 环 是 单 向 的 。 

(3) 进程 不 知道 环 的 大 小 。 

(4) 假设 信道 满足 fifo。 这 种 假设 并 没有 弱化 结果 。 因 为 非 fifo 的 算法 也 不 比 fifo 算 法 有 更 
好 的 复杂 度 。 

(5) 假设 所 有 进程 都 是 初始 进程 。 这 种 假设 并 没有 弱化 结果 。 因 为 对 于 每 个 分 散 式 算法 ， 
它 描述 了 一 种 可 能 情形 。 

(6) 假设 算法 是 消息 驱动 的 。 即 ， 算 法 开始 执行 ， 并 发 送 一 些 消息 之 后 ， 进 程 仅 当 接 到 
一 条 消息 时 ， 才 进一步 发 送 消息 。 当 考虑 异步 系统 时 ， 一 般 算法 不 会 比 消息 驱动 的 算法 有 更 
好 的 复杂 度 。 事 实 上， 如 果 4 是 一 个 异步 算法 ， 那 么 消息 驱动 的 算法 B 可 构造 如 下 。 开 始 执行 
并 接 到 消息 之 后 ，B 发 送 4 所 允许 发 送 的 最 大 消息 序列 而 没有 接收 消息 。 只 有 在 那 时 ， 才能 接 
收 下 一 条 消息 。 算 法 8 不 仅 是 消息 驱动 的 ， 而 且 B 的 每 次 计算 是 4 的 一 次 可 能 计算 (可 能 在 相 
当 翡 观 的 消息 传输 延迟 分 布 之 下 )。 

后 三 条 假设 消除 了 系统 的 非 确定 性 。 在 这 些 假设 之 下 ， 从 给 定 初始 配置 开始 的 每 次 计算 ， 
包含 相同 的 事件 集合 。 

在 本 小 节 中 ，s = (s, o sy) ERAR EERE D 表 示 所 有 这 些 序列 的 集合 ， 














即 
D={ (Sis ..., &) SE P Hi+j= 2 +s} 


len(s) 表示 序列 s 的 长 度 。s! 表 示 序 列 s: 和 :的 连接 。;s 的 循环 移 位 (cyclic shift) 是 一 个 序 
列 s's"， 其 中 s = "s', 有 具有 形式 s;，.…， SNo Sis as Sito CS(s) 表 示 s 的 循环 移 位 集合 。 当然 ， 
ICS(s) l= len(s)。 

称 环 以 序列 (s1，...，sw) 为 标号 ， 如 果 进 程 标识 "到 sw 以 此 顺序 出 现在 环 上 (规模 为 N 的 环 )。 
标号 为 的 环 也 称 为 s- 环 。 如 果 ! 是 s 的 循环 移 位 ， 那 么 t- 环 和 s- 环 相同 。 

对 于 算法 中 发 送 的 每 一 条 消息 ， 将 会 有 一 个 进程 标识 序列 与 此 相关 ， 称 为 消息 的 轨迹 
(trace)。 如 果 m 是 进程 p 接 到 消息 之 前 所 发 送 的 -- 条 消息 ， 那 么 ， m 的 轨迹 就 是 (p)。 如 果 mm 是 
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进程 p 接 到 轨迹 为 * = (s ，…，s) 的 消息 之 后 所 发 送 的 消息 ， 那 么 ，m 的 轨迹 就 是 (5s1，.…， 
st，p)。 具 有 轨迹 :的 消息 称 为 s- 消 息 。 可 从 算法 发 送 所 有 消息 的 轨迹 集合 的 性 质 导出 算法 的 
TH. 
设 E 是 D 的 子 集 ， 集 合 E 是 穷 举 的 (exhaustive )， 如 果 
(1) E 是 闭 前 级 的 , Bru EE 二 1:EE; H. 
(2) EARED, Hl, Vs ED: CS(s) NE +ø. 
以 下 将 要 表明 ， 算 法 中 的 所 有 轨迹 集合 是 穷 举 的 ， 为 了 从 这 个 事实 导出 算法 复杂 度 的 下 
界 ， 需 要 定义 集合 E 的 两 种 度量 。 如 果 序 列 : 是 r E CS(s) 的 前 级 ， 则 在 s- 环 中 ， 序 列 出 现 为 标 
识 的 连续 序列 。M(s，E) 是 s- 环 中 以 这 种 方式 出 现 的 E 的 序列 的 个 数 ，Mi (s，E) 表示 长 为 k 
的 这 些 串 的 个 数 : 
M(s, EV=I\{t EE: 十 某 些 rE CS(s) 的 一 个 前 级 } | 
E 
M, (s, E) =I 4 EE: t 是 某 些 r €E CS(s) 的 一 个 前 弘 且 len(1)=k}| 


设 A 是 计算 最 小 标识 的 算法 ， 定 义 E4 为 序列 s 的 集合 ， 满 足 当 算法 4 在 5- 环 上 执行 时 ， 发 送 
SAE. 

引 理 7.10 teRsrtousy te, 4AIL LAH, Riks-M&, MASMRAAU- 
环 上 执行 时 ， 也 发 送 s- 消 息 。 

证 明 。 进 程 s: 发 送 的 s- 消 息 ， 其 中 s = (5 ，.…，%)， 只 在 因果 关系 上 依赖 于 进程 9 到 进程 w。 
它们 在 w- 环 上 的 初始 状态 与 在 t- 环 上 的 初始 状态 相同 (这 里 ， 我 们 记 住 环 大 小 是 未 知 的 )， 因 
此 进行 消息 发 送 的 事件 的 集合 在 uw- 环 上 也 是 可 应 用 的 。 0 

引 理 7.11 E.R FER, 

证 明 。 为 证 明天 是 闭 前 缀 的 ， 观 察 可 见 ， 如 果 4 在 *- 环 上 执行 时 ， 发 送 一 条 *- 消 息 ， 那 么 ， 
对 于 s 的 每 个 前 级 :，A 首 先 在 s- 环 上 发 送 一 条 -消息 。 由 引 理 7.10，4 在 t- 环 上 发 送 一 条 -消息 ， 
Altre 已。 

为 证 明 E4 循 环 覆盖 D， 考 虚 s- 环 上 4 的 一 次 计算 。 至 少 有 一 个 进程 对 最 小 标识 判定 。 这 草 
含 着 (类似 于 定理 6.11 所 用 的 方法 )， 这 个 进程 已 经 接 到 轨迹 长 度 为 len(s) 的 消息 。 这 个 轨迹 
是 :的 循环 移 位 ， 且 在 E 中 。 口 

引 理 7.12 在 s- 环 上 的 一 次 计算 中 ， 算 法 A 至 少 发 送 M(s，E。) 条 消息 。 

证 明 。 设 1 © 是 s 的 循环 移 位 r 的 前 级。 由 EE 的 定义 ，4 在 t- 环 上 的 一 次 计算 中 ， 发 送 一 个 
上 消息， 因此 ， 在 玉环 上 也 发 送 一 个 上 消息， 这 个 r 环 等 于 *- 环 。 因 此 ， 对 于 每 个 : 

{tEE: ! 是 某 些 r € CS(s) 的 一 个 前 级 } 

在 s- 环 上 的 一 次 计算 中 ， 至 少 发 送 一 条 tf- 消息 。 这 就 证 明了 那 次 计算 中 的 消息 数 至 少 是 MM 
(s, E). 口 
对 于 进程 标识 的 有 限 集合 7/， 设 Per(7) 表示 /的 所 有 排列 的 集合 。aves (1) 表示 4 所 用 的 消 
息 的 平均 数 ， 其 中 算法 A 在 所 有 以 /中 的 标识 作 标 记 的 环 上，wors (1) 表示 最 坏 情 况 下 的 消息 
数 。 前 述 引 理 表 明 ， 如 果 7 有 AN 个 元 素 ， 那 么 


1 
I — 
(1) ave (I) > M py MEW), A 
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(2) wor, (I) > max M(s.E,. | 


通过 分 析 任 意 穷 举 集合 证 明 下 界 。 
定理 7.13 单 向 寻找 最 小 标识 的 算法 平均 情况 复杂 度 至 少 为 N . Hy. 
证 明 。 对 所 有 标 以 集合 /的 初始 配置 求 平均 数 ， 可 得 


1 
aves(1) > M MOED 


我 们 固定 kx， 对 于 每 个 s E Per(1)， 有 N 个 长 为 的 s 的 循环 移 位 前 缀 。Per(1) 中 有 NI 个 排 
Bil, 产生 NN. N! 个 这 类 前 级 ， 可 以 分 成 N . NURS, 每 组 包含 一 个 序列 的 k 个 循环 移 位 。 因 为 ， 
Es 循环 地 覆盖 D，E4 与 每 个 小 组 相交 。 因 此 ， 

N-N 
l a OER > k 
KASS 
1QN-M 
ave ,(1) > way RN He. o 

这 个 结果 表明 ， 如 果 考 虑 平均 情况 ，Chang-Roberts 算 法 是 最 优 的 。 最 坏 情 况 下 的 复杂 度 
至 少 等 于 平均 情况 ， 这 蕴含 着 最 坏 情 况 下 可 达 的 最 好 的 复杂 度 介 于 NN - Hy =0.69N log N 和 = 
1.356N log N 之 间 。 

本 节 的 证 明 结 果 ， 主 要 依赖 于 环 是 单 向 的 和 环 大 小 未 知 这 两 个 假设 。 在 假设 双向 
(bidirectional) 环 和 环 大 小 未 知 的 条 件 下 ， Bodiaender[Bod88] 证 明了 选举 算法 的 平均 情况 复 
杂 度 下 界 为 1/2 N. Hn 。 为 了 从 双向 环 上 消除 非 确定 性 ， 考虑 这 样 一 种 计算 ， 其 中 每 个 进程 同 
时 开始 和 每 条 消息 具有 相同 传输 延迟 。 对 于 已 知 环 大 小 的 情况 ， Bodlaender[Bod91a] 证 明了 单 
向 环 上 的 一 个 下 界 1/2 N. log N 和 双向 环 上 的 下 界 (1/4-€)N - Hy (两 种 都 为 平均 情况 )。 

总之， 由 上 可 得 ， 环 上 选举 算法 的 复杂 度 对 几乎 所 有 能 够 做 的 假设 不 敏感 。 无 论 环 大 小 
已 知 还 是 未 知 ， 双 向 还 是 单 向 ， 也 无 论 是 考虑 最 坏 情 况 复杂 度 还 是 平均 情况 复杂 度 ， 其 复杂 
度 在 所 有 情况 下 都 为 8(N log N)。 关键 是 环 是 异步 的 。 对 于 全 局 时 间 可 用 的 网 络 ， 消 息 复杂 
度 较 低 ， 参 见 第 12 章 。 

当 在 分 散 式 波 动 算法 的 一 次 计算 中 ， 可 以 选 出 领导 人 时 ， 选举 的 下 界 也 部 含 了 波动 算法 
的 下 界 。 ， 

推论 7.14 任何 环 网 上 的 分 散 式 波动 算法 至 少 交 换 @UN log N) 条 消息 ， 对 于 平均 情况 和 
最 坏 情 况 均 如 此 。 


7.3 任意 网 


现在 研究 任意 网 的 选举 问题 。 未 知 的 网 络 拓扑 结构 和 没有 近邻 知识 可 用 。 以 下 将 给 出 消 
息 复杂 度 的 一 个 下 界 Q(N log N + 1E1)。 证 明 过 程 结合 了 定理 6.6 的 思想 和 前 面 小 节 中 的 一 些 结 
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果 。 在 7.3.1 小 节 中 ， 给 出 了 最 坏 情 况 下 ， 具 有 低 时 间 复 杂 度 、 高 消息 复杂 度 的 一 个 简单 算法 。 
7.3.2 节 提出 了 最 坏 情况 下 的 一 个 最 优 算法 。 

定理 7.15 任意 网络 上 基于 比较 的 选举 算法 至 少 具有 Q(IEl + N log N) 的 消息 复杂 度 (最 
坏 情况 和 平均 情况 )。 

证 明 。Q(N log N) 项 是 一 个 下 界 ， 因 为 任意 网 络 包括 环 ， 而 在 环 上 此 下 界 成 立 。 为 了 
证 明 IEI 个 消息 也 是 一 个 下 界 ， 即 使 在 所 有 计算 中 最 好 情况 。 假 设 选举 算法 4 在 网 络 G 上 有 一 
次 计算 C， 在 计算 中 需要 交换 的 消息 数 小 于 IE1， 参 见 图 7-8。 在 C 中 不 用 的 一 条 边 上 插入 节点 ， 
用 这 两 节点 间 的 一 条 边 连 接 G 的 两 个 拷贝 来 构造 G'。 网 络 中 两 部 分 标识 与 G6 中 的 标识 具有 相 
同 的 相对 次 序 。 在 G' 的 两 部 分 中 可 以 同时 模拟 计算 C， 产 生 一 次 计算 ， 在 计算 中 两 个 进程 当 
选 。 l g 

推论 7.16 ”在 没有 近邻 知识 的 任意 网 络 上 ， 分 散 式 波动 算法 消息 复杂 度 至 少 为 @ (IEL+ 
log N). 





G G1 G Go 
图 7-8 有 两 个 领导 人 的 计算 


7.3.1 废止 和 快速 算法 


RA Rak (extinction) 的 构造 过 程 应 用 于 任意 集中 式 波动 算法 ， 就 得 到 领导 人 选举 算 
法 。 在 所 得 的 选举 算法 中 ， 每 个 初始 进程 分 别 开 始 波动 ， 由 进程 开始 执行 的 波动 消息 必须 加 
上 标号 p， 以 便 将 它们 与 来 自 不 同 波动 的 消息 区 别 出 来 。 算 法 保证 ， 不 管 开始 多 少 次 波动 ， 只 
有 一 个 波动 进行 判定 ， 即 ， 具 有 最 小 初始 进程 的 波动 进行 判定 。 在 发 生 判 定之 前 ， 所 有 其 他 
波动 将 会 中 止 。 

对 于 波动 算法 4， 选 举 算法 Exz(4) 如 下 。 每 个 进程 每 次 至 多 在 一 个 波动 中 是 活动 的 ;这 
个 波动 是 它 的 当前 活动 波动 (currently active wave ) ， 用 caw 表 示 ， 其 初始 值 为 wdef。 选 举 中 
的 初始 进程 作用 开始 执行 一 次 波动 并 caw 设 为 自己 的 标识 。 如 果 由 4 开始 执行 的 某 些 波动 的 消 
息 到 达 p，p 处 理 这 些 消息 如 下 。 如 果 g > caw,， 那 么 简单 忽略 消息 ， 有 效 地 引起 g 的 波动 失败 。 
如 果 4 = caw,， 那 么 完全 按照 波动 算法 处 理 消息 。 如 果 g < caw,， 或 者 caw, 为 udef， 那 么 通过 
重 设 变量 到 初始 值 ， 且 设 caw := 4， 将 P 加 入 到 4 的 波动 执行 。 当 4 开始 的 波动 执行 一 个 判定 事 
件 时 (在 大 多 数 波动 算法 中 ， 这 种 判定 总 是 发 生 在 gq 中 )，g 将 当选 。 如 果 波 动 算法 满足 判定 进 
程 不 必 是 初始 进程 ， 判 定 进程 经 过 引 理 6.3 中 定义 的 生成 树 通知 初始 进程 。 这 至 多 需要 花费 V- 
1 条 消息 。 在 下 个 定理 中 ， 我 们 将 忽略 这 些 。 

定理 7.17 如 果 A 是 集中 式 波动 算法 ， 每 次 波动 利用 M 条 消息 ， 那 么 算法 Ex(A) 至 多 利用 
NM 条 消息 选 出 领导 人 。 

证 明 。 设 po 是 最 小 初始 进程 ， 由 po 初始 的 波动 立刻 就 被 接收 该 波动 消息 的 进程 加 入 。 因为 
没有 更 小 标识 的 波动 ， 会 异常 终止 po 波动 的 执行 ， 因 此 每 个 进程 都 会 完成 这 次 波动 。 因此 po 的 
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波动 运行 到 完成 ， 并 发 生 判定 ， 最 终 po 成 为 领导 人 。 

如 果 p 是 非 初 始 进程 ， 标 识 为 p 的 波动 未 曾 被 开始 执行 ， 因 此 p 不 会 变 成 领导 人 。 如 果 P + 
Po 是 初始 进程 ， 标 识 为 p 的 波动 将 开始 ， 但 是 po 中 的 发 送 事 件 (对 于 这 次 波动 ) 将 在 这 个 波动 
的 判定 之 前 发 生 ， 或 者 这 个 波动 中 的 判定 在 po 中 发 生 ( 引 理 6.4)。 由 于 po 从 不 执行 标识 为 p 的 
波动 中 的 发 送 事 件 ， 或 者 内 部 事件 ， 因 此 这 样 的 判定 并 不 发 生 ，p 不 会 被 选中 。 

至 多 开始 N 次 波动 ， 每 个 波动 至 多 利用 M 条 消息 ， 使 得 总 复杂 度 达到 NM。 

估算 时 间 复 杂 度 Ex( 4) 是 一 个 更 细致 的 问题 。 在 许多 情况 下 ， 它 的 时 间 复 杂 度 和 4 的 时 间 
复杂 度 具 有 相同 的 数量 级 。 然 而 令 人 遗憾 的 是 ， 可 能 县 有 最 小 标识 的 初始 进程 很 迟 才 开始 它 
的 波动 。 在 一 般 情 况 下 ， 其 时 间 复 杂 度 为 DO(N . 1) (其 中 1 是 波动 算法 的 时 间 复 杂 度 )。 因 为 在 
初始 进程 p 开 始 波动 后 的 ! 个 时 间 单位 内 ，P 的 波动 判定 ， 或 者 开始 另 一 次 波动 。 

如 有 果 将 废止 方法 应 用 于 环 网 算法 ， 就 得 到 Chang-Roberts 算 法 。 参 见习 题 7.9。 图 7-9 所 示 
的 算法 给 出 了 由 回 波 算法 所 得 的 选举 算法 。 为 了 简化 描述 ， 假 设 对 于 所 有 4 © P, udef >q. 
由 图 7-9 所 示 算 法 得 知 ， 一 旦 接收 带 有 / < caw, 的 消息 <tok ，r> ， 由 于 稍 早 对 caw, 的 赋值 ， 就 
会 执行 条 件 为 r = caw, 的 让 语句 。 当 进程 p 当 选 时 (已 经 接 到 来 自 每 个 近邻 的 消息 <tok，p>),p 
将 消息 <ldr，p> 分 散 到 所 有 进程 中 ， 通 知 它们 p 是 领导 人 ， 使 得 它们 终止 算法 的 执行 。 

















var caw, :Pp init udef; (* Currently active wave *) 
recp : integer init 0; (* Number of (tok, caw, ) received *) 
father, : P init udef; (* Father in wave cawp *) 
lrecp : integer init 0 ; (* Number of (ldr, .) received *) 
winp :P init udef; (* Identity of leader *) 


begin if p is initiator then 
begin caw, := p ; 
forall q € Neigh, do send (tok, p) to q 
end ; 
while ;recp < #Neigh, do 
begin receive msg from q ; 
if msg = (ldr,r) then 
begin if lrec, = 0 then 
forall q € Neigh, do send (Idr,r) to q ; 
lrecy := lrecp 十 1 ; wing := r 
end 
else (* a (tok,r) message *) 
begin if r < caw, then (* Reinitialize algorithm *) 
begin cawp :=r ;recp :一 0 ; father, := q ; 
forall s € Neigh,, s#q 
do send (tok,r) to s 
end ; 
if r = caw, then 
begin recy := recy +1; 
if rec, = # Neigh, then 
if caw, = p 
' then forall s € Neigh, 
do send (ldr,p) to s 
else send (tok, caw, ) to father, 





图 7-9 废止 方法 应 用 于 回 波 算法 
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end 
(* If r > caw ,, the message is ignored *) 


end 
end ; 
if win, = p then state, := leader else state, := lost 
end 





图 7-9 (4%) 


7.3.2 Gallager-Humblet-Spira 算 法 


任意 网 络 上 的 选举 问题 与 用 分 散 式 算法 计算 生成 树 的 问题 密切 相关 。 设 Cs 是 选举 问题 的 
消息 复杂 度 ，Cy 是 计算 生成 树 的 消息 复杂 度 。 定 理 7.2 蕴 含 C: < Cr + O(N)。 如 果 领 导 人 可 
用 ， 利 用 带 回 波 算法 的 21EIl 条 消息 就 可 以 计算 生成 树 。 这 蕴含 着 ，Cr < Ce + 2E. Ce (定理 
7.15) 的 下 界 蕴 含 着 这 两 个 问题 复杂 度 具 有 相同 的 数量 级 ， 即 它们 至 少 要 求 Q&(N log N + El) 
条 消息 。 

本 小 节 给 出 计算 (最 小 ) 生成 树 的 Gallager-Humblet-Spira (GHS) 算法 ， 消 息 复杂 度 为 
2IEl +5 N log N。 这 表明 Cg 和 C7 为 @(N log N + El)。 这 个 算法 发 表 在 文献 [GHS83] 上。 可 以 很 
容易 地 修改 这 个 算法 (本 小 节 最 后 简要 说 明 ) 使 得 在 计算 的 过 程 中 选 出 领导 人 ， 上 述 论 证 中 
所 指出 的 单独 选举 没有 必要 。 

GHS 算 法 依赖 如 下 假设 。 

(1) 每 条 边 : 有 惟一 的 权 值 Xe)， 这 里 假设 axe) 是 实数 ， 但 是 整数 也 有 可 能 作为 边 的 权 值 。 

如 有 果 惟 一 的 边 权 值 预先 不 可 用 ， 可 将 由 这 条 边 所 连接 节点 的 标识 作为 权 值 赋 给 每 条 边 。 
两 者 中 较 小 者 优先 。 由 于 计算 边 的 权 值 要 求 节点 知道 近邻 标识 ， 因 此 在 算法 开始 执行 阶段 ， 
这 需要 另外 2IEIl 条 消息 。 

(2) 所 有 节点 尽管 初始 时 处 于 睡 卢 态 ， 但 它们 在 算法 开始 执行 时 苏醒 。 有 些 节点 自然 地 
被 唤醒 (如果 由 于 这 些 节点 中 出 现 的 情况 变化 ， 触 发 了 算法 执行 )， 其 他 节点 可 能 仍 在 睡眠 态 
时 ， 就 接 到 算法 的 消息 。 在 后 一 种 情况 下 ， 接 收 节 点 首先 开始 执行 局 部 过 程 ， 然 后 处 理 消息 。 

最 小 生成 树 ” 设 G = (V, E) 是 带 权 图 ， 其 中 w(e) 表 示 边 e 的 权 值 。G 的 生成 树 7 的 权 值 等 
于 7 中 所 包含 的 N-1 条 边 的 权 值 之 和 。 如 果 没 有 一 棵 树 其 权 值 比 7 的 权 值 小 ， 则 称 7 为 最 小 生成 
树 (minimal spanning tree), MST, (有 时 称 为 最 小 权 值 生成 树 ，minimal-weight spanning 
tree)。 本 小 节 中 ， 假 设 每 条 边 具 有 惟一 权 值 ， 即 ， 不 同 边 具 有 不 同 权 值 。 这 是 一 个 众所周知 
的 事实 ， 在 这 种 情况 下 ， 有 惟一 的 一 棵 最 小 生成 树 。 

命题 7.18 如 果 所 有 边 权 值 不 同 ， 则 有 惟一 一 棵 MST。 

证 明 。 反 证 法 。 假 设 T, 和 T, (WPT =T) 都 是 最 小 生成 树 。 设 e 是 出 现在 其 中 一 棵 树 中 
权 值 最 小 的 边 ， 但 并 不 在 两 棵 树 中 都 出 现 。 由 于 Tz* 7,， 因 此 这 样 的 边 存 在 。 不 失 一 般 性 ， 假 
Reet}, RETE. AT, U {e} 包 含 回 路 ， 因 为 Ti 不 含 回 路 ， 因 此 这 条 回路 中 至 少 有 一 条 边 
e' 不 在 7 中 。e 的 选择 表明 ，w(e) < ale), BERT U {e}\{e'} 具 有 比 T 更 小 的 权 值 。 这 与 是 
MST 了 矛盾 。 CI 

命题 7.18 使 得 分 布 式 构造 最 小 生成 树 变 得 相当 容易 。 因为 不 需 从 合法 解 的 集合 做 出 选择 
(分 布地 )。 正 相反 ， 每 个 节点 只 需 局 部 地 选择 属于 任 一 最 小 生成 树 的 边 ， 加 入 到 全 局 惟一 最 
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小 生成 树 MST 的 构造 中 。 

计算 最 小 生成 树 的 所 有 算法 基于 片断 (fragment) 表示 ， 它 是 MST 的 一 棵 子 树 。 称 边 e 是 
片断 F 的 出 边 (outgoing edge )， 如 果 e 的 一 个 端点 在 F 中 ， 另 一 个 端点 不 在 Ff 中。 算法 从 由 一 个 
节点 构成 的 片断 开始 ， 逐 步 增 大 片断 直到 完成 MST 的 构造 。 

命题 7.19 如 果 下 是 片断 ，e 是 天 的 最 小 带 权 出 边 ， 那 么 忆 U {e} 是 片断 。 

证 明 。 假 设 F U {e} 不 是 MST 的 一 部 分 ， 那 么 e 与 MST 中 某 些 边 形成 回路 ， 且 在 这 个 回路 
中 ，MST 中 的 一 条 边 是 上 的 一 条 出 边 。 由 e 的 选择 ，w(e) < (有 )， 但 接着 从 MST 中 删除 [/， 并 插 
入 e， 则 得 到 一 棵 比 MST 具 有 更 小 权 值 的 树 ， 这 与 MST 是 最 小 生成 树 矛盾 。 

著名 的 计算 MST 的 顺序 算法 是 Prim 算 法 和 Kruskal 算 法 。Prim 算 法 [CLR90，24.2 节 ] 从 单 
一 片断 开始 ， 在 每 步 中 ， 用 当前 片断 中 具有 最 小 权 值 的 出 边 逐 渐 扩大 片断 。Kruskal 算 法 
[CLR90，24.2 节 ] 从 单 节 点 片断 集合 开始 ， 在 每 步 中 ， 用 每 个 片断 中 最 小 带 权 出 边 逐 渐 扩 大 片 
断 ， 并 对 产生 的 片断 进行 归并 。 因 为 kruskal 算 法 可 以 独立 地 处 理 片 断 ， 因 此 它 更 适合 于 在 分 
布 式 算法 中 实现 。 


7.3.3 GHS 算 法 的 全 局 描述 


从 片断 的 观点 来 看 ， 我 们 首先 描述 算法 是 如 何以 全 局 方式 运转 的 。 然 后 描述 每 个 节点 必 
须 执行 的 局 部 算法 ， 通 过 该 局 部 算法 获得 片断 的 全 局 操作 。 

GHS 算 法 的 计算 按 以 下 几 步 进行 : 

1) 保持 片断 集合 ， 满 足 所 有 片断 的 并 集 包 括 所 有 节点 。 

2) 初始 时 ， 集 合 中 包含 的 每 个 节点 是 由 一 个 节点 组 成 的 片断 。 

3) 通过 片断 中 的 节点 找 出 片断 的 最 小 带 权 出 边 。 

4) 当 已 知 片 断 的 最 小 带 权 出 边 时 ， 通 过 增加 出 边 ， 将 片断 之 间 连 接 过 来 。 

5) 当 只 剩 一 个 片断 时 ， 算 法 终止 。 

为 了 有 效 地 实现 这 些 步 又 ， 需 要 引入 一 些 表 示 和 机 制 。 

(1) 片断 名 。 为 了 决定 最 小 加 权 输出 边 ， 必 须 能 够 确定 是 否 一 条 边 是 出 边 或 者 是 通 向 同 
一 片断 中 的 节点 。 因 此 ， 每 个 片断 将 有 一 个 名 字 ， 且 该 名 字 要 为 那个 片断 中 的 进程 所 知 。 进 
程 通过 比较 它们 的 片断 名 ， 就 可 断定 一 条 边 是 内 部 边 还 是 出 边 。 

(2) 大 小 片断 的 组 合 。 当 组 合 两 个 片断 时 ， 至 少 有 一 个 片断 中 的 进程 片断 名 改变 ， 这 就 
要 求 两 个 片断 中 至 少 有 一 个 片断 ， 对 其 中 每 个 节点 进行 更 新 。 为 了 保持 更 新 效率 ， 组 合 策略 
采取 把 两 个 片断 中 的 较 小 者 组 合 进 两 个 片断 中 的 较 大 者 中 ， 并 沿用 较 大 片断 名 作为 新 片断 名 。 

(3) 片断 级 。 稍 微 思考 可 以 看 出 ， 对 两 个 片断 中 的 哪 一 个 是 较 大 者 的 判定 ， 并 不 是 基于 
两 个 片断 中 的 节点 数 。 这 就 需要 在 大 小 子 片断 的 每 个 进程 中 ， 更 新 片断 大 小 ， 因 此 破坏 了 所 
需要 的 性 质 ， 即 ， 更 新 只 需 发 生 在 较 小 片断 中 的 性 质 。 因 此 我 们 为 每 个 片断 赋予 -- 个 级 ，0 表 
示 初 始 的 只 含 一 个 节点 的 片断 。 当 片断 F 和 更 高 一 级 的 片断 忆 组 合 后 ， 新 片断 FU 五 的 级 与 
的 级 相同 。 新 片断 和 F, 同 名。 因此 无 需 对 Fs 中 的 节点 更 新 。 也 可 能 是 两 个 同 级 片断 进行 组 
合 ， 在 这 种 情况 下 ， 新 片断 有 一 个 新 名 字 ， 它 的 级 别 比 当前 被 组 合 的 片断 高 一 级 。 片 断 的 新 
名 字 为 组 合 两 个 片断 的 边 上 的 权 值 。 这 条 边 称 为 新 片断 的 核心 边 (core edge)。 核 心 边 所 连接 
的 两 个 节点 称 为 核心 节点 (core node). 
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引 理 7.20 “如果 满足 这 些 组 合 条 件 ， 则 进程 改变 它 的 片断 名 或 者 片断 级 的 次 数 至 多 为 N 
log N。 

证 明 。 进 程 级 永远 不 会 减 小 ， 仅 当 进 程 级 增加 时 ， 进 程 改变 片断 名 。 级 Z 的 片断 中 至 少 包 
含 2: 个 进程 。 因 此 最 大 级 为 lo0g NW。 这 草 含 着 每 个 进程 级 至 多 增加 log N 次 。 因 此 ， 片 断 名 和 片 
断 级 改变 的 总 数 为 N log N。 | 

组 合 策略 概述 F = (FN, L) 表示 名 为 FN 和 级 为 L 的 片断 Fe 表示 F 的 最 小 加 权 出 














边 。 
规则 A ”如 果 er 通 向 L < 了 的 片断 忆 = (FN',，L')，F 组 合成 Fr， 新 片断 名 为 FN'， 片 断 级 为 
L， 这 些 新 值 被 发 送 到 F 中 的 所 有 进程 中 。 
规则 B 如 果 es 通 向 L = 工 的 片断 已 = (FN', L'), Her = er， 这 两 个 片断 组 合成 新 片断 ， 
片断 级 为 +1， 片 断 名 为 w(er)。 这 些 新 值 被 发 送 到 F 和 关中 的 所 有 进程 中 。 
规则 C 在 所 有 其 他 情况 下 〈 如 , L> LRAL = L'Her* er), 片断 F 必 须 等 待 直到 规则 A 
或 者 规则 B 被 应 用 。 


7.3.4 GHS 算 法 的 详细 描述 


1. 节点 和 链 路 状态 
节点 p 保 持 变 量 ， 如 图 7-10 所 示 的 算法 所 述 。 其 中 包括 每 个 信道 pq 的 状态 stach,[q1。 读 状 
态 是 分 支 的 〈branch) ， 如 果 得 知 它 是 MST 中 的 一 条 边 ; 该 状态 是 废弃 的 (reject)， 如 果 它 不 
是 MST 中 的 一 条 边 ， 该 状态 是 基本 的 〈basic)， 如 果 这 条 边 仍 未 用 。 决 定 片断 中 最 小 带 权 出 边 
的 通信 ， 在 片断 的 分 支边 进行 。 对 于 片断 中 的 进程 Pp，father, 就 是 通 向 片断 中 核心 边 的 边 。 如 
果 节 点 p 当 前 正在 查找 片断 中 的 最 小 带 权 输出 边 ， 节 点 p 的 状态 statey 为 查找 状态 ， 否 则 处 于 已 
找到 状态 。 如 同 图 7-10、 图 7-11 和 图 7-12 所 示 的 算法 , 给 出 了 该 算法 。 有 时 局 部 条 件 满足 以 后 ， 
才能 处 理 消 息 。 在 这 种 情况 下 ,假设 消息 被 存储 ， 以 后 再 找 回 并 处 理 ， 就 好 像 在 那个 时 刻 已 
经 接收 到 一 样 。 如 果 进 程 接收 一 条 消息 ， 而 它 仍 在 睡眠 状态 ， 那 么 在 处 理 消 息 之 前 ， 算 法 在 
那个 节点 开始 执行 (通过 执行 行为 (1))。 
var state, : (sleep, find, found) ; 
stach,|(q] : (basic, branch, reject) for each q € Neigh, ; 
namep, bestwty : Teal ; 
level, : integer ; 
testchy, bestchy, father, : Neigh, ; 
TECp : integer ; 


(1) As the first action of each process, the algorithm must be initialized: 
begin let pq be the channel of p with smallest weight ; 


stachp[q] := branch ; level, := 0 ; 
statep := found ; recy := 0; 
send (connect,0) toq 


end 


(2) Upon receipt of (connect, L} from q: 
begin if L < level, then (* Combine with Rule A *) 
begin stach,[q] := branch ; 





图 7-10 Gallager-Humblet-Spira# (PART 1) 
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send (initiate, level, namep, state, ) to q 


end 
else if stachp|q] = basic 
then (* Rule C *) process the message later 
else (* Rule B *) send (initiate, level, + 1, w(pq), find ) to q 


end 


(3) Upon receipt of (initiate, L, F, S ) from q: 
begin level, := L ; name, := F ; state, := S ; father, :=q ; 
bestchy := udef ; bestwtp := oo ; 
forall r € Neigh, : stach,[r] = branch Ar # q do 
send (initiate, L, F, S) tor ; 
if statep = find then begin recp := 0 ; test end 
end 





图 7-10 (4) 


(4) procedure test: 
begin if 3q € Neigh, : stachp|g] = basic then 
begin testch, := q with stachplq] = basic and w(pq) minimal ; 
send (test, level,, name, ) to testchy 
end 


else begin testch, := udef ; report end 
end 


(5) Upon receipt of (test, L, F } from q: 
begin if L > levelp then (* Answer must wait! *) 
process the message later 
else if F = name, then (* internal edge *) 
begin if stach,|q] = basic then stachy[q] := reject ; 
if q # testch, 
then send (reject ) to q 
else test 
end 
else send (accept ) to q 
end 


(6) Upon receipt of (accept ) from q: 
begin testch, := udef ; 
if w(pq) < bestwt, 
then begin bestwt, := w(pq) ; bestch, := q end : 
report 


end 


. (7) Upon receipt of (reject) from q: 
begin if stach,[q] = basic then stach,|q] := reject ; 
test 
end 





_ 图 7-11 GALLAGER-HUMBLET-SPIRA 算 法 (PART 2) 
2. 找 最 小 带 权 出 边 


片断 中 的 节点 相互 协作 以 找 出 片断 中 的 最 小 带 权 出 边 。 如 果 找 到 ， 则 通过 这 条 边 发 送 消息 
<connect，L>,L 是 片断 级 。 如 果 片 断 只 由 一 个 节点 组 成 ， 就 像 是 这 个 节点 初始 化 后 的 情形 ， 





7È AEH A 155 








所 求 边 即 为 这 个 节点 的 最 小 权 值 近邻 边 ， 参 见 行为 (1)。 经 过 这 条 边 发 送 消 息 <conmnect，0>。 








(8) procedure report: 
begin if rec, = #{q : stachp|q| = branch Aq # father,} 
and tesich, = udef then 
begin state, := found ; send (report, bestwt,) to father, end 
end 


(9) Upon receipt of (report,w) from q: 
begin if q # father, 
then (* reply for initiate message *) 
begin if w < bestwt, then 
begin bestwt, := w ; bestch, := q end ; 
Tecp := TECp + 1 ; report 
end 
else (* pq is the core edge *) 
if state, = find 
then process this message later 
else if w > bestwt, 
then changeroot 
else if w = bestwt, = co then stop 
end 


(10) procedure changeroot: 
begin if stach,[bestch,] = branch 
then send (changeroot ) to bestch, 
else begin send (connect, level, ) to bestchy ; 
stach,[bestch,| := branch 





end 
end 


(11) Upon receipt of (changeroot ): 


begin changeroot end 





' 图 7-12 GALLAGER-HUMBLET-SPIRA #7 (PART 3) 


接 下 来 考虑 通过 组 合 两 个 片断 形成 新 片断 的 情形 ， 通 过 边 e = pg 连接 。 如 果 两 个 被 组 合 的 
片断 具有 相同 级 别 L， 则 p 和 gq 都 将 经 过 e 发 送 消 息 <connect，L>， 且 当 e 的 状态 为 分 支 状 坊 时 ， 
则 反 过 来 接收 消息 <connect，L>， 参 见 行为 (2)。 边 pq 成 为 片断 的 核心 边 。p 和 g 交 换 消息 
<initiate，L+1，N，5>， 给 出 片断 的 新 级 别 和 片断 名 。 片 断 名 为 w(pq)， 状 态 find 引 起 每 个 进 
程 开始 查找 最 小 带 权 出 边 ， 参 见 行为 (3)。 消 息 <initiate，L +1，N，5> 被 扩散 到 新 片断 中 的 
每 一 个 节点 。 如 果 p 的 片断 级 小 于 g 的 片断 级 ，p 将 经 过 e 发 送 消 息 <connect，L>， 反 过 来 接收 gq 
所 发 送 的 消息 <initiate，L'，N，S>， 参 见 行为 (2)。 在 这 种 情况 下 ，L' 和 N 是 当前 的 片断 级 和 
4 的 名 字 ， 该 边 上 4 这 一 边 的 节点 名 和 级 别 并 不 改变 。 在 这 条 边 上 p 这 一 边 ， 初 始 消息 被 扩散 到 
所 有 节点 中 (参见 行为 (3))， 使 得 每 个 进程 更 新 它 的 片断 名 和 级 别 。 如 果 g 当 前 正在 查找 最 
小 带 权 出 边 (3 = find)， 通 过 调用 test，p 的 片断 中 的 进程 加 入 查找 过 程 。 

片断 中 的 每 个 进程 通过 它 的 边 〈 如 果 边 存在 ， 参 见 行为 (4)、(5)、(6) 和 (7)) 查找 是 
否 存在 直通 片断 外 的 边 ， 如 果 有 直通 片断 外 的 边 ， 选 择 一 条 权 值 最 小 的 边 。 利用 消息 <report， 
> 向 每 棵 子 树 报告 这 条 最 小 带 权 出 边 ， 参 见 行为 (8)。 节点 p 利 用 变量 recv， 对 它 所 接 到 的 消 
息 <report，w> 进 行 计数 ， 在 查找 开始 时 ， 它 的 值 设 为 0 (参见 行为 (3))。 随 着 每 次 接 到 消息 ， 
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它 的 值 增加 (参见 行为 (9))。 当 进程 从 其 子 节点 已 接 到 这 样 的 消息 时 ， 并 完成 局 部 查找 出 边 后 ， 
便 向 其 父 节 点 发 送 消 息 <report，w>。 

每 个 进程 沿 着 核心 边 的 方向 发 送 消 息 <report，w>， 两 个 核心 节点 的 消息 在 这 条 边 上 相 
过 ， 都 接收 来 自 father 的 消息 ， 参 见 行为 (9)。 在 核心 节点 处 理 其 他 进程 的 消息 之 前 ， 每 个 核心 
节点 等 待 发 送 自己 的 消息 <report，w>。 当 核心 节点 的 两 条 消息 <report，w> 相 遇 时 ， 核 心 节 
点 知道 最 小 带 权 出 边 的 权 值 。 如 果 在 该 点 上 根本 没有 出 边 报告 (两 个 消息 都 报告 值 w )， 则 算 
法 终止 。 

如 果 报 告 一 条 出 边 ， 从 报告 最 好 边 的 核心 节点 开始 ， 沿 着 每 个 节点 中 bestch 指 针 找到 最 好 
的 边 。 消 息 <connect，L> 必 须 通过 这 条 边 发 送 ， 片 断 中 所 有 father 指 针 必须 指向 这 个 方向 ， 可 
以 通过 发 送 消 息 <changeroot> 完 成 。 在 最 小 带 权 出 边 所 定位 的 那 一 边 的 核心 节点 发 送 消息 
<changeroot>， 经 过 通 向 最 小 带 权 出 边 的 树 完成 发 送 ， 参 见 行为 (10) 和 行为 (11)。 当 消息 
<changeroot> 到 达 依 附 于 最 小 带 权 出 边 的 节点 时 ， 这 个 节点 通过 最 小 带 权 出 边 发 送 消息 
<connect, L>, 

3. 测试 边 

为 了 找到 最 小 带 权 出 边 ， 节 点 p 按 照 权 值 增加 的 次 序 逐 个 检查 它 的 基本 边 ， 参 见 行 为 (4)。 
当 没 有 边 剩余 时 (所 有 边 都 是 废弃 边 或 者 分 支边 )， 参 见 行为 (4)， 或 者 找到 一 条 出 边 时 ， 参 见 
行为 (6)， 局 部 查找 边 结束 。 因 为 p 按 照 次 序 检 查 这 些 边 ， 因 此 如 果 p 识 别 出 一 条 出 边 ， 那 么 它 
必然 是 来 自 p 的 最 小 带 权 出 边 。 

为 检查 边 pg，p 向 q 发 送 消息 <test，level,，name,>， 并 等 待 应 答 ， 这 种 应 答 可 以 是 
<reject>, ，<accept> 或 者 <test,， 了 上 ，F> 消 息 。 如 同 在 铀 试 消息 中 ， 如 果 进 程 4 发 现 p 的 片断 名 与 
9 的 片断 名 一 致 ， 进 程 9 发 送 消息 <reject> (参见 行为 (5))。 在 这 种 情况 下 ， 节点 4 也 丢弃 这 条 
边 。P 一 且 接 到 消息 <reject>，p 丢 弃 边 pg， 并 继续 进行 局 部 查找 ， 参 见 行为 (7)。 如 果 4 正 好 利 
用 边 p4 发 送 <test， 工 ，F> 消 息 ， 可 以 省 略 <rejecet> 消 息 。 在 这 种 情况 下 ，d 的 消息 <test，L， 
F> 作 为 对 p 的 消息 的 应 答 ， 参 见 行为 (5)。 如 果 g 的 片断 名 与 p 的 片断 名 不 同 ， 就 发 送 <accept> 
消息 。 pp 一旦 接 到 这 个 消息 , 就 终止 对 出 边 的 局 部 查找 ， 并 选择 边 pg 作为 局 部 查找 的 最 好 结果 ， 
参见 行为 (6)。 

ARL > level,，p 则 延期 处 理 消息 <test，L，F>。 原 因 是 p 和 g 可 能 属于 同一 个 片断 ， 但 是 
iA <initiate, L, F, SERENA Hp. 节点 p 可 能 用 一 条 消息 <accept>， 错 误 应 答 q。 

4. 组 合 片断 

确定 片断 F = (name, level) 的 最 小 带 权 出 边 后 ， 经 过 这 条 边 发 送 消息 <connect level>, 
由 属于 片断 F' = (name', level') 中 的 节点 接收 这 条 消息 。 发 送 消 息 <connect， level> 的 进程 
为 ?， 接 收 这 条 消息 的 进程 是 gq。 节 点 q 较 早 发 送 消 息 <accept> 给 p， 作 为 对 消息 <test，level， 
name> 的 应 答 、 因 为 这 时 在 p 的 片断 中 已 经 终止 查找 最 好 出 边 。 在 回答 测试 消息 (参见 行为 (5)) 
之 前 引入 的 等 待 ， 蕴 含 着 /evel'> level, 

按照 早先 讨论 的 组 合 规则 ， 在 两 种 情况 下 ， 用 消息 <initiate, L, FFP， S> 回 答 消 息 
<connect, level>., 

情形 A: 如 果 level> level，p 的 片断 被 吸收 ， 通 过 消息 <initiate， level'，name'，$> 通 知 片 
断 中 的 节点 新 的 片断 名 和 片断 级 ， 它 将 这 条 消息 扩散 到 片断 F 的 所 有 节点 中 .。 在 片断 严 的 生成 
树 中 ， 整 个 被 吸收 的 片断 FF 变 成 g 的 一 棵 子 树 。 如 果 g 当 前 在 片断 F' 中 查找 最 好 出 边 ， 那么 F 中 
的 所 有 进程 必须 参加 查找 。 这 就 是 为 什么 g 在 它 的 消息 <initiate， level'，name'，$> 中 包含 它 
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的 状态 (finde found) 的 原因 。 

情形 B: 如 果 两 个 片断 具有 相同 的 级 别 ， 则 片断 正 的 最 好 出 边 也 是 pg， 形 成 的 新 片断 高 1 
级 ， 片 断 名 为 边 pg 上 的 权 值 ， 参 见 行为 (2)。 如 果 两 个 片断 级 相等 ， 并 且 经 过 分 支边 接收 连接 
消息 ; 就 会 出 现 这 种 情况 。 观 察 可 见 ， 如 果 二 条 连接 消息 通过 一 条 边 发 送 ， 那 么 这 条 边 的 状 

如 果 这 两 种 情况 都 不 出 现 ， 片 断 F 必 须 等 待 ， 直 到 4 发 送 消 息 <connect，L> 消 息 ， 或 者 4 的 
片断 级 足够 增加 到 使 情形 A 是 可 应 用 的 。 

5. 正确 性 和 复杂 度 

从 算法 的 详细 描述 可 得 ， 片 断 发 送 消息 <connect，L> 所 通过 的 那 条 边 ， 就 是 片断 的 最 小 
带 权 出 边 。 结 合 命题 7.19 可 得 ， 尽 管 算法 导致 的 等 待 存在 ， 但 如 果 每 个 片断 确实 发 送 这 样 一 
条 消息 ， 并 加 入 其 他 片断 中 ， 则 MST 的 计算 是 正确 的 。 最 复杂 的 消息 包括 一 个 边 权 值 、 一 个 
级 别 (可 达到 log N) 以 及 表示 消息 类 型 和 节点 状态 的 固定 数目 的 位 。 

定理 7.21 Gallager-Humblet-Spira 计 算 最 小 生成 树 的 算法 (图 7-10、 图 7-11、 图 7-12 所 示 
的 算法 )， 至 多 利用 5 N log N +2IBEI 条 消息 。 

证 明 。 死 锁 本 质 上 是 由 于 节点 或 者 片断 等 待 另 一 节点 或 者 片断 中 的 条 件 出 现 所 引起 的 。 
核心 边 上 引入 的 对 消息 <report，w> 的 等 待 不 会 导致 死 锁 ， 这 是 因为 每 个 核心 节点 最 终 都 会 接 
到 来 自 所 有 子 节 点 的 报告 (除非 整个 片断 都 在 等 待 另 -片断 )， 然 后 处 理 消息 。 

考虑 片断 F， = (level, name) 中 的 消息 到 达 片断 已 = (level, name,) 中 一 个 节点 的 情 
形 。 如 果 ieve > level,， 并 且 通 过 同一 条 边 ， 片 断 F, 还 没有 发 送 消 息 <connect，level;>， 则 
消息 <connect，level1> 必 须 等 待 ， 参 见 行为 (2)。 如 果 level, > levels, 则 消息 <test，Level， 
name1> 必 须 等 待 。 参 见 行 为 (5)。 在 FF 等 待 F, 的 所 有 情况 中 ， 以 下 情形 之 一 成 立 。 

(1) level, > level; 

(2) level, = level, ^ wler,) >wl(er,) ; 

(3) level, = level, A wler,) =w(er,) ; FAFA ERR ER DBR. (因为 er 是 已 的 
出 边 ， 所 以 wm(er,) >wler,) 的 情形 不 可 能 出 现 。) 

因此 ， 不 会 出 现 死 锁 回 路 。 


每 条 边 至 多 被 废弃 一 次 ， 这 需要 两 条 消息 ， 其 限定 了 废弃 消息 数 加 上 导致 废弃 的 测试 消 


息 数 共 为 2I5l。 在 任何 一 级 上 ， 节 点 至 多 接收 一 条 初始 消息 、 一 条 接收 销 息 ， 发 送 至 多 一 -条 报 
告 消息 、 一 条 改变 根 的 消息 ， 或 一 条 连接 消息 、 以 及 一 条 不 会 导致 废弃 的 测试 消息 。 在 0 级 ， 
没有 接收 消息 ， 也 不 发 送 报告 消息 或 者 测试 消息 。 在 最 高 级 上 ， 每 个 节点 只 发 送 报告 消息 和 
接收 一 次 初始 消息 。 因 此 消息 的 总 数 至 多 为 5 N log N +2IEl。 g 


7.3.5 GHS 算 法 的 讨论 和 变化 


Gallager-Humblet-Spira 算 法 是 最 复杂 的 波动 算法 之 一 ， 只 需要 局 部 知识 ， 就 能 得 到 最 优 
消息 复杂 度 。 很 容易 扩展 该 算法 ， 选 出 领导 人 ， 而 这 些 只 需 增加 两 条 消息 。 算 法 在 两 个 节点 
上 终止 ， 即 ， 最 后 片断 〈 生 成 整个 网 络 ) 的 核心 节点 上 。 不 用 执行 stop ， 核 心 节 点 交换 标识 ， 
其 中 较 小 者 成 为 领导 人 。 

已 有 大 量变 化 和 相关 算法 发 表 ， 如 果菜 些 节点 开始 算法 很 晚 ，GHS 算 法 就 会 要 求 Q(N?) 
的 时 间 。 如 果 使 用 另外 的 唤醒 过 程 ( 至 多 再 需要 21EIl 条 消息 )， 算 法 的 时 间 复 杂 度 为 SN logN, 
参见 习题 7.11。Awerbuch[Awe87] 表 明 ， 算 法 的 时 间 复杂 度 可 以 改进 到 O(N)， 同时 保持 算法 
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的 消息 复杂 度 最 优 ， 即 O(1El +N log N). 

Afek 等 人 [ALSY90] 改 进 了 算法 ， 所 计算 的 生成 森林 具有 很 好 性 质 。 即 ， 每 棵 树 的 直径 和 
树 的 个 数 为 O( VN )。 他 们 的 算法 可 以 分 布地 计算 网 络 的 簇 ， 如 引 理 4.47 所 表明 的 那样 。 并 且 
计算 生成 树 和 敌 的 中 心 。 

也 许 有 人 会 问 ， 任 意 生成 树 的 构造 是 否 比 最 小 生成 树 的 构造 更 有 效 。 定 理 7.15 给 出 了 构造 
任意 生成 树 的 复杂 度 下 界 Q(NlogN + IEI) 。 在 网 络 是 稀疏 的 条 件 下 ，Johansen 等 人 [JJN+87] 给 
出 了 计算 任意 生成 树 的 算法 ， 该 算法 利用 3N log N+ 2 IEIHO(N) 条 消息 ， 因 此 通过 一 个 常数 
因子 改进 了 GHS 算 法 。Bar-Ilan 和 Zernik[BIZ89] 提 出 了 计算 随机 生成 树 的 算法 ， 其 中 以 等 概率 
选择 每 棵 可 能 的 生成 树 。 算 法 随机 化 ， 利 用 的 期 望 消息 数 介 于 O(N log N +E) 和 O(N3) 之 间 ， 
这 取决 于 网 络 的 拓扑 结构 。 

在 任意 网 上 ， 构 造 任意 生成 树 和 最 小 生成 树 具 有 相同 的 难度 。 但 在 团 上 却 不 是 这 样 。 
Korach、Moran 和 Zaks[KMZ85] 已 经 证 明 ， 在 带 权 的 困 上 ， 构 造 最 小 生成 树 需 要 交换 Q (WN?) 
条 消息 。 结 果 表 明 ， 拓 扑 结构 知识 并 没有 降低 在 定理 7.1S 给 出 的 下 界 下 寻找 MST 的 复杂 度 。 
团 网 上 任意 生成 树 的 构造 可 用 O(N log N) 条 消息 。 下 一 节 中 将 要 讨论 。 也 可 参见 [KMZ84]。 


7.4 Korach-Kutten-Moran 算 法 


至 今 已 得 到 许多 选举 问题 的 算法 。 不 仅 有 环 网 、 任 意 网 ， 还 有 其 他 一 些 特殊 的 拓扑 结构 ， 
如 团 网 等 。 在 几 种 情况 下 ， 最 好 的 已 知 算法 ， 其 消息 复杂 度 为 O(N log w)。 在 某 些 情况 下 ， 
这 个 结果 还 可 与 下 界 Q(N log N) 相 匹 配 。Korach、Kutten and MoranfKKM901 表 明 ， 在 选举 
问题 和 网 络 的 遍历 之 间 有 着 紧密 的 关系 。 主 要 结果 是 给 出 一 类 网 络 的 遍历 算法 ， 为 该 类 网 络 
构造 一 个 有 效 的 选举 算法 。 

这 种 构造 为 许多 网 络 产生 O(N log N) 的 选举 算法 。 因 为 O(x) (线性 ) 的 遍历 是 可 能 的 
最 好 结果 ， 用 这 项 技术 不 可 能 获得 更 好 的 算法 。 相 反 ， 许 多 具有 方向 侦 听 的 网 络 允 许 有 更 好 
的 选举 算法 ， 在 第 11 章 中 将 会 看 到 。 同 时 ，Korach-Kutten-Moran 算 法 的 时 间 复 杂 度 与 消息 复 
杂 度 相同 。 在 某 些 情况 下 ， 具 有 同样 消息 复杂 度 的 其 他 算法 具有 更 低 的 时 间 复杂 度 。 构 造 具 
有 一 般 性 ， 在 解决 更 高 一 级 的 问题 时 ， 如 选举 问题 ， 遍 历 之 间 所 形成 的 关系 作为 “模块 ” 调 
用 。 


7.4.1 模块 构造 


Korach-Kutten-Moran 算 法 利用 废止 构造 (7.3.1 小 他 ) 和 Peterson/Dolev-Klawe-Rodeh 算 法 
(72.2 小 节 ) 的 思想 。 与 废止 构造 的 类 似 之 处 在 于 ， 选 举 的 初始 进程 通过 以 它们 的 标识 所 标记 
的 令 牌 ,开始 遍历 网 络 。 如 果 遍 历 完 成 (判定 )， 那 次 遍历 的 初始 进程 当选 。 算 法 表明 ， 只 在 
一 次 遍历 中 进行 选举 。 本 小 节 描述 的 算法 假设 信道 满足 fifo， 但 是 通过 在 每 个 令 牌 中 和 每 个 进 
程 中 维持 更 多 的 信息 ， 可 以 修改 算法 使 其 适合 于 非 fifo 的 情况 ， 参见 [KKM90]。 

为 了 处 理 多 于 一 个 初始 进程 的 情形 ， 算 法 按照 级 (level) 操作 ， 与 Peterson/Dolev_Klawe- 
Rodeh 算 法 中 的 轮 相 对 应 。 如 果 至 少 开 始 两 次 遍历 ， 那么 令 牌 将 要 到 达 已 经 被 其 他 令 牌 访问 过 
的 进程 。 如 果 出 现 这 种 情形 ， 通 过 所 到 达 的 令 牌 将 中 止 这 次 遍历 。 算法 的 目标 现在 变 成 将 两 
个 令 牌 放 在 一 个 进程 中 ， 并 在 进程 中 杀 死 它们 ， 开 始 新 的 遍历 。 与 Peterson/Dolev 等 人 的 算法 
相 比 ， 在 一 轮 中 ， 每 两 个 标识 中 至 多 有 一 个 幸存 ， 并 继续 到 下 一 轮 次 。 在 Korach-Kutten- 





条 7 业 AEK HX 159 





Moran 算 法 中 用 级 的 概念 代替 轮 的 概念 ;， 仅 当 两 个 令 牌 具有 相同 的 级 时 ,它们 将 引起 新 的 遍历 。 
新 产生 的 令 牌 高 出 一 级 。 如 果 令 牌 遇 到 高 一 级 的 令 牌 ， 或 者 到 达 已 被 高 一 级 令 牌 访问 的 节点 ， 
到 达 的 令 牌 则 简单 地 被 杀 死 ， 而 不 影响 更 高 一 级 的 令 牌 。 

图 7-13 所 示 的 算法 描述 了 这 个 算法 。 为 了 将 同 级 令 牌 放 在 一 个 进程 中 ， 每 个 令 牌 处 于 三 
种 模式 之 一 : 合并 (annexing), at (chasing) RF (waiting). A (q, 1) RASH, 
其 中 g 表 示 令 牌 的 初始 进程 ，! 表 示 它 的 级 别 。 变 量 lev, 表 示 进 程 p 的 级 ， 变 量 cats 表 示 p 所 转发 
的 最 后 合并 令 牌 的 初始 进程 (p 的 当前 活动 遍历 )。 如 果 没 有 令 牌 等 待 >， 变 量 waits 值 为 udef; 
mRE (q, lev) 等 待 ， 变 量 waitp 值 为 9。 变 量 Iastz 用 于 处 于 追赶 模式 的 令 牌 : 如 果 追 赶 
令 牌 不 在 它 之 后 发 送 ，p 和 将 级 为 lev, 的 合并 令 牌 转发 给 它 的 近邻 ， 在 这 种 情况 下 ，last, = udef. 
算法 将 遍历 算法 作用 函数 trav 调 用 。 函 数 trav 返 回 到 令 牌 必须 被 转发 至 的 近邻 ,或 者 如 果 遍 历 
终止 ， 则 返回 判定 。 


var levy : integer init 一 1 ; 
catp, waitp : P init udef ; 
lastp : Neigh, init udef ; 


begin if p is initiator then 
begin [ep := levp + 1 ; last, := trav(p, levp) ; 
catp := p ; send (annex, p, lev, ) to last, 
end ; 
while ... (* Termination condition, see text *) do 
begin receive token (q, l) ; 
if token is annexing then t := A else t:=C ; 
if | > lev, then (* Case I *) 
begin lev, := l ; catp:=q; 
wait, = udef ; ‘last, = trav(q, l) ; 
send (annex, q,t) to ‘last, 
end 
else if 1 = levy and wait, # udef then (* Case II *) 
begin Wait, := = udef ; levp := lev, +1; 
last, = trav(p, levp) ; catp =p; 
send (annex, p, levy) to last, 
end 
else if | = lev, and last, = udef then (* Case III *) 
wait, := q 
else if | = levp and t = A and q = cat, then (* Case IV *) 
begin last, := trav(q, l) ; 
if lasty = decide 
then p announces itself leader 
else send (annex, g,!) to lastp 
end 
else if | = lev, and ((t = A and 
q > catp) or t = C) then (* Case V 9 
begin send (chase, q,/) to last, ; last, := udef end 
else if l = lev, then (* Case VI *) 
watt, := q 
end 





图 7-13 Korach-Kutten-Moran 算 法 
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在 合并 模式 中 令 牌 (q,，1) 开始 执行 ， 在 这 种 模式 中 ， 该 令 牌 服从 遍历 算法 〈 如 同 图 7-13 
所 示 的 算法 中 的 Case IV ) ， 直 到 出 现下 列 情形 之 一 。 

(1) 志 历 算法 终止 : 在 这 种 情况 下 ，4 当 选 为 领导 人 (参见 图 7-13 所 示 的 算法 中 的 Case IV )。 

(2) 令 牌 到 达 级 为 lev, > ! 的 节点 p: 在 这 种 情况 下 ， 令 牌 被 杀 死 。( 这 种 情况 列 含 在 图 7- 
13 中 所 示 的 算法 ， 算 法 中 的 条 件 要 求 ，!> lev, 或 者 [= lev,. ) 

(3) 令 牌 到 达 一 个 节点 ， 其 中 级 为 ! 的 令 牌 正在 等 待 ， 在 这 种 情况 下 ， 两 个 令 牌 被 杀 死 。 
从 那个 节点 开始 新 的 遍历 (参见 图 7-13 所 示 的 算法 中 Case I). 

(4) 令 牌 到 达 级 为 ! 的 节点 ,而 且 访 节点 最 近 已 被 标识 为 caty> 4 的 令 牌 访问 过 (参见 Case 
VI), 或 者 被 追赶 令 牌 访问 过 (参见 Case IL): 令 牌 在 那个 节点 变 成 等 待 状态 。 

(5) 令 牌 到 达 级 为 /的 节点 ， 而 且 该 节点 最 近 已 被 标识 为 cat。< g 的 合并 令 牌 访问 过 : 在 这 
种 情况 下 ， 令 牌 变 成 追赶 状态 ， 并 用 和 前 一 令 牌 相同 的 信道 发 送 (参见 Case V). 

每 个 节点 经 过 最 近 刚 发 送 过 令 牌 的 信道 ， 转 发 关 赶 令 牌 (gq，/)， 直 到 出 现 以 下 情形 之 一 。 

(1) 令 牌 到 达 级 为 ley, > 1 的 进程 : 在 这 种 情况 下 ， 令 牌 被 杀 死 。 

(2) 令 牌 到 达 一 个 进程 ， 它 有 一 个 级 为 的 等 待 令 牌 : 这 两 个 令 牌 被 删除 ， 通 过 这 个 进程 
开始 新 的 遍历 (参见 Case IL). 

(3) 令 牌 到 达 级 为 /的 进程 ， 其 中 最 近 传递 的 令 牌 处 于 追赶 状态 : 令 牌 变 成 等 待 状态 (2 
见 Case HI). 

等 待 令 牌 驻 留 在 进程 中 ， 直 到 出 现 以 下 情形 之 一 。 

(1) 高 一 级 的 令 牌 到 达 同 一 个 进程 ， 等待 令 牌 被 杀 死 (参见 Case 1). 

(2) 相同 级 的 令 牌 到 达 : 两 个 令 牌 被 删除 ， 开 始 高 一 级 的 遍历 (参见 Case II), 

在 图 7-13 所 示 的 算法 中 ,忽略 了 遍历 算法 中 所 用 的 变量 和 令 牌 信息 。 观 察 可 见 ， 如 果 p 搂 
到 Elev, 更 高 级 别 的 令 牌 这 是 一 个 p 不 为 初始 进程 的 合并 令 牌 。 如 果 遍 历 终止 在 p 中 ，p 成 为 
领导 人 ， 并 把 消息 扩散 到 所 有 进程 中 ， 引 起 它们 终止 。 

1. 正确 性 和 复杂 度 , 

为 了 证 明 Korach-Kutten-Moran 算 法 的 正确 性 ， 要 表明 每 一 级 中 所 产生 的 令 牌 数 递 碱 ， 直 
到 在 某 一 级 ， 只 有 一 个 令 牌 产 生 ， 其 中 初始 者 当选 。 

引 理 7.22 。 如果 在 级 I! 所 产生 的 令 牌 数 k > 1, 那么 在 级 ! +1 至 少 产 生 一 个 令 牌 ， 至 多 产生 
Kk/2 个 令 牌 。 

证 明 。 在 级 ! +1 至 多 产生 kK/2 个 令 牌 ,这 是 因为 ， 每 产生 一 个 令 牌 ， 同 时 将 级 ! 的 两 个 令 牌 
杀 死 。 
假设 存在 级 !， 满 足 在 级 [产生 > 1 个 令 牌 ， 但 在 ! +1 级 不 产生 令 牌 .。 设 gq 是 在 级 /产生 的 具 
有 有 最大 标识 的 进程 令 牌 。 令 牌 (9，1) 没有 完成 遍历 ， 因 为 它 将 被 已 转发 级 ! 另 一 个 令 牌 的 进 
程 p 接 收 。 当 这 种 情形 首次 发 生 时 ，(g，/) 变 成 迫 赶 模式 ， 或 者 如 果 p 已 经 转发 追赶 令 牌 ，(9， 
1) 变 成 等 待 状态 。 不 管 是 娜 一 种 情形 ， 级 /都 存在 追赶 令 牌 。 

设 (r, 1) 是 且 具 有 最 小 标识 的 令 牌 ， 其 后 发 送 追 赶 令 牌 。 令 牌 (r，1) 自身 并 不 是 迫 赶 
令 牌 ， 因 为 令 牌 仅仅 追赶 具有 最 小 标识 的 令 牌 。 当 它 首次 到 达 进 程 pm"， 并 且 该 进程 已 经 转发 了 
级 的 另 一 令 牌 ， 这 时 可 以 假定 r, D 变 成 等 待 状态 。 设 p" 是 (C, D) 路径 上 所 接收 的 最 后 一 
个 进程 ， 在 它 转发 (r, 1) 之 后 ， 合 并 令 牌 变 成 追赶 r 的 令 牌 。 这 个 追赶 令 牌 或 者 遇见 p' 中 的 
(r, 门 ， 或 者 放弃 追赶 ， 如 果 在 令 牌 到 达 p 之 前 ， 发 现 一 个 等 待 令 牌 。 在 两 种 情况 下 ， 产 后 级 
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为 +1 的 一 个 令 牌 。 这 是 一 个 矛盾 。 

定理 7.23 Korach-Kutten-Moran 算 法 (图 7-13 所 示 的 算法 ) 是 选举 算法 。 

证 明 。 假 设 至 少 有 一 个 进程 开始 执行 算法 。 由 前 述 引 理 ， 在 每 一 级 中 所 产生 的 令 牌 数 弟 
减 ， 则 存在 级 为 !/， 其 中 只 产生 一 个 令 牌 ， 即 ，(9，1)。 没 有 级 为 f< /的 令 牌 来 完成 遍历 ， 因 
此 ， 这 些 令 牌 中 没有 一 个 会 使 得 进程 当选 。 在 级 /的 惟一 令 牌 只 会 遇见 级 小 于 /的 进程 ， 或 者 
cat = g (如 果 到 达 已 经 访问 过 的 一 个 进程 )， 在 这 两 种 情况 下 ， 惟 一 令 牌 被 转发 。 因 此 ， 令 牌 
的 遍历 完成 ，9 当 选 。 

RRRA Li (convex), MR(a) + f(b) <Aa+p)。 在 分 析 算法 时 ， 假 设 利用 / (x)- 遍 
历 算法 (886.34), HADAR. 

定理 7.24 ”如 果 利 用 /CD)- 遍 历 算 法 ， 且 /为 凸 画 数 ， 那 么 KKM 选 举 算法 利用 至 多 (1+ log 
k) [f(N) + N] 条 消息 ， 假 设 开始 时 有 Kk 个 进程 执行 算法 。 

证 明 。 如 果 有 k 个 进程 开始 执行 算法 。 在 级 /至 多 产生 2-' k 个 令 牌 这 蕴含 着 ， 最 高 一 级 至 
多 为 [log k]. 

在 每 一 级 上 ， 每 个 进程 至 多 发 送 一 个 标识 的 合并 令 牌 ， 如 果 在 某 些 级 ! 上 ， 有 一 些 标识 》 
Po s Pj 的 令 牌 并 且 有 Ni; 个 进程 已 经 转发 了 合并 令 牌 (p;，!)， 那 么 ， 由 此 可 
得 ， SNS NM 。 因 为 遍历 算法 是 / (x) BH, ESRF ) 次 合并 令 牌 (p,，/)， 这 使 
得 在 第 [级 携带 合并 令 牌 的 消息 总 数 至 多 达到 D /(N,) ， 因 为 /是 西 函数， 所 以 消息 总 数 至 多 
为 / (N)。 每 个 进程 每 级 至 多 发 送 一 次 追赶 令 牌 ， 这 使 得 每 级 追赶 令 牌 数 至 多 为 N。 

因此 ， 至 多 有 (1+ logk) 个 不 同 级 ， 每 级 至 多 发 送 / (N) + N 条 消息 ， 结 果 得 证 。 o 

2. Attiya 的 构造 

Attiya 从 遍历 算法 构造 了 另 一 种 选举 算法 [Att87]。 在 所 构造 的 算法 中 ， 一 旦 标识 为 9 的 令 
牌 到 达 一 个 已 被 另 一 进程 p 的 令 牌 访问 过 的 进程 "， 它 的 遍历 不 被 中 止 。 合 并 令 牌 不 是 在 r 处 等 
待 ， 而 是 发 出 “搜寻 进程 ” 令 牌 , 来 追赶 p 的 令 牌 ， 如 果 成 功 地 击败 了 p， 则 返回 到 r。 如 果 搜 
寻 进 程 返 回 ， 就 不 必要 开始 新 的 遍历 ， 而 是 ， g 中 令 牌 的 当前 遍历 继续 进行 ， 因 此 潜在 地 节 
省 了 消息 复杂 度 。 为 了 使 搜寻 进程 返回 到 进程 处， 必须 假设 网 络 是 双向 的 。 如 果 利用 f (x) 遍 
历 算法 ， 所 得 选举 算法 的 消息 复杂 度 近似 为 3. "FCN /i) « 


7.4.2 KKM 算 法 的 应 用 


如 果 存在 一 类 网 络 的 f (x)- 遍 历 算法 ， 称 这 类 网 络 为 f(x)- 可 遍历 的 。 因为 许多 网 络 是 
00- 可 遍历 的 ， 构 造 给 出 了 消息 复杂 度 为 O(N log N) 的 选举 算法 ， 这 些 是 已 知 的 最 好 结果 。 
在 某 些 情况 下 ， 当 存在 方向 侦 听 时 ， 可 以 构造 更 好 的 算法 (和 参见 第 11 章 )。 

1. 环 上 的 选举 

环 是 x- 可 遍历 的 ， 因 此 ，KKM 算 法 在 环 上 选举 领导 人 利用 2N log N 条 消息 。 由 定理 7.13 
可 知 ， 这 可 能 是 最 好 的 结果 。 

2. 团 上 的 选举 

团 是 2x- 可 遍历 的 ， 在 没有 方向 侦 听 的 情况 下 ， 按 照 定理 7.24， KKM 算 法 利用 3N log N 
条 消息 在 田 上 选举 领导 人 。 对 算法 的 仔细 分 析 ， 揭示 出 算法 实际 上 的 消息 复杂 度 为 2N log N 
+ O(N)。 至 多 利用 三 次 追赶 消息 就 可 以 追 上 每 个 令 牌 。 因此 一 次 计算 中 追赶 消息 的 总 数 为 
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3.》 “27N = O(N) 。 到 目前 为 止 ， 不 存在 比 复杂 度 为 2w log N+ O(N) 更 好 的 团 上 选举 
Wik. Korach, Moran and ZaksIKM2Z84] 证 明了 它 的 下 界 为 Q(N log N). 

这 些 结果 仅 适 合 于 没有 方向 侦 听 的 图 。 如 果 有 方向 侦 听 ， 则 存在 团 上 的 线性 算法 。 

3. 圆 环 上 的 选举 

有 共有 方向 侦 听 的 圆 环 网 络 是 x- 可 遍历 的 (参见 图 6.11 所 示 的 算法 )， 因 此 KKM 算 法 在 圆 环 
上 利用 2N log N 条 消息 选举 领导 人 。 如 果 没 有 方向 侦 听 ， 可 以 利用 Tarry 算 法 进行 遍历 ， 并 且 
在 圆 环 上 该 算法 是 线性 操作 的 。Peterson[Pet85] 已 经 给 出 了 网 格 和 圆 环 上 的 选举 算法 ， 消 息 复 
杂 度 为 O(N)， 并 且 不 要 求 对 边 进行 标号 。 


习题 
7.1 节 


7.1 如 果 把 进程 变 成 领导 人 的 事件 看 作 是 判定 事件 ， 证 明 任 意 网 上 基于 比较 的 选举 算法 
是 波动 算法 。 
7.2 证 明 算 法 7-1 的 时 间 复 杂 度 为 2D。 
7.2 节 


7.3 证 明 7.2.1 小 节 中 所 用 的 等 式 : YH, =(m+DH, -m , 

7.4 证 明 ln(N+l1)<Hnvw<ln(N) +1。(ln 表 示 自 然 对 数 ) 

7.5 考虑 Chang-Roberts 算 法 ,假设 每 个 进程 都 是 初始 进程 。 如 何在 环 上 分 布 标识 使 得 消 
息 复 杂 度 达到 最 小 ? 在 这 种 情况 下 ， 需 要 多 少 次 消息 交换 ? 

7.6 如 果 只 有 5 个 初始 进程 ， 并 且 S 个 进程 中 的 每 一 个 进程 等 概率 成 为 初始 进程 集 ， 那么 ， 
Chang-Roberts 算 法 在 平均 情况 下 的 复杂 度 是 多 少 ? 

7.7 给 出 算法 7-7 的 一 个 初始 配置 ， 且 算法 实际 需要 [log N| +1 轮 。 另外， 给 出 算法 只 
要 2 轮 的 一 个 初始 配置 ， 不 管 有 多 少 个 初始 进程 。 算 法 在 一 轮 中 可 能 终止 吗 ? 

7.8 确定 Chang-Roberts 算 法 的 集合 Ece (正如 在 引 理 7.10 之 前 所 定义 的 )。 


7.3 节 


7.9 把 废止 原理 应 用 到 环 算法 ， 并 与 Chang-Roberts 算 法 比较 。 差 别 是 什么 ? 差别 的 影响 
有 多 大 ? 
7.10 ”对 于 在 Gallager/Humblet/Spira 算 法 中 所 用 的 7 种 消息 的 每 一 种 ， 确 定 是 否 这 种 类 型 


”的 消息 可 发 送 给 处 于 睡眠 状态 的 节点 。 


7.11 假设 GHS 算 法 利用 另外 一 种 唤醒 过 程 ， 来 保证 每 个 节点 在 N 个 时 间 单 位 内 开始 执行 
算法 。 

用 归纳 法 证 明 至 多 5N 1~3N 个 时 间 单 位 后 ， 每 个 节点 处 在 级 别 1。 

证 明 算 法 在 5 N log N 个 时 间 单 位 内 终止 。 


7.4 节 


7.12 证 明 平 面 网 络 上 存在 O(N log N) 的 选举 算法 。 
7.13 证 明 没有 方向 侦 听 的 回环 网 络 上 存在 DO(N log N) 的 选举 算法 。( 提 示 : 分 析 Tarry 
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算法 在 圆 环 上 的 性 能 。) 

7.14 证 明 没有 方向 侦 听 的 超 立 方 体 网 络 上 存在 O(N log N) 的 选举 算法 。 

7.15 ”证 明 节 点 度 界限 为 的 网 络 上 存在 O(N(log N +k)) 的 选举 算法 ( 即 ， 网 络 中 每 个 
节点 至 多 有 K 个 近邻 )。 





第 8 章 终止 检视 


当 算 法 达到 终止 配置 时 ， 分 布 式 算法 的 计算 终止 。 即 配置 中 不 存在 进一步 可 应 用 的 算法 
步 。 在 终止 配置 中 ， 并 不 总 是 存在 这 样 一 种 情形 ， 即 ， 每 个 进程 处 于 终止 状态 ， 也 就 是 说 ， 
进程 所 处 的 状态 没有 事件 可 应 用 。 考 虑 一 种 配置 ， 其 中 每 个 进程 处 于 允许 接收 的 状态 ， 且 所 
有 信道 为 空 。 这 样 的 配置 是 终止 的 ， 但 是 进程 状态 可 能 是 计算 过 程 的 中 间 状 态 。 在 这 种 情况 
下 ， 进 程 并 没有 意识 到 计算 已 经 终止 ， 称 计算 的 终止 是 隐 式 的 。 如 果 终 止 配置 中 进程 的 状态 ， 
就 是 进程 的 终止 状态 ， 则 称 计 算 的 终止 是 显 式 的 。 计 算 的 隐 式 终止 也 称 为 消息 终止 ， 因 为 在 
达到 终止 配置 时 ， 没 有 更 多 的 消息 要 交换 。 显 式 终止 也 称 为 进程 终止 ， 因 为 如 果 算 法 显 式 终 
止 ， 进 程 已 经 终止 。 

通常 ， 设 计 隐 式 终止 算法 要 比 显 式 终止 算法 容易 。 确 实 ， 在 算法 设计 过 程 中 ， 忽 略 了 有 
关 进 程 正确 终止 的 各 个 方面 ， 算 法 设计 主要 关注 如 何 限制 事件 发 生 的 总 数 。 另 一 方面 ， 算 法 
的 应 用 可 能 要 求 进程 显 式 终止 。 仅 当 显 式 终止 之 后 ， 才 认为 计算 结果 是 最 终 的 ， 并 将 计算 中 
的 变量 丢弃 。 同 时 ， 分 布 式 算法 的 死 锁 导致 终止 配置 ， 在 这 种 情况 下 ， 达 到 终止 配置 时 ， 必 
须 重 新 开始 计算 。 

本 章 研究 将 消息 -终止 的 算法 变 成 进程 -终止 的 算法 的 一 般 方法 。 给 定 这 样 一 个 方法 ， 在 算 
法 设计 时 ， 只 需 考 虑 消息 终止 ( 即 ， 保 证 算法 只 允许 有 限 次 的 计算 )。 利 用 其 中 一 种 方法 ， 可 
将 消息 -终止 的 算法 变 成 进程 -终止 的 算法 。 方 法 由 另外 两 个 算法 组 成 ， 这 两 个 算法 与 给 定 的 消 
息 -终止 的 算法 相 结合 ， 其 中 一 个 算法 负责 观察 计算 ， 并 检查 计算 是 否 已 经 达到 了 算法 的 终止 
状态 。 然 后 ， 它 调用 第 二 个 算法 ， 把 终止 消息 扩散 到 所 有 进程 中 ， 使 得 它们 进入 终止 状态 。 

转换 的 最 难 部 分 是 检测 算法 终止 性 的 算法 。 扩 散 的 过 程 相当 繁琐 ， 将 在 8.1.3 节 中 简要 讨 
论 。 可 以 证 明 ， 对 于 已 知 其 上 波动 算 靶 的 所 有 网 络 ， 终 止 检 测 是 可 能 的 。 这 些 网 络 包括 : 领 
导 人 可 用 的 网 络 、 具 有 进程 标识 的 网 络 、 树 网 ， 和 拓扑 结构 信息 已 知 的 网 络 ， 如 已 知 网 络 直 
径 和 进程 个 数 。 另 一 方面 ， 在 第 9 章 中， 将 要 表明 ， 对 于 未 知 大 小 的 匿名 网 络 ， 存 在 隐 式 终止 
算法 ， 但 是 不 存在 计算 进程 输入 最 大 值 的 显 式 终止 算法 。 因 此 ， 当 匿名 网 络 的 大 小 未 知 时 ， 
终止 检测 是 不 可 能 的 。 

对 于 可 以 进行 终止 检测 的 情况 ， 我 们 将 建立 终止 检测 算法 中 消息 交换 数 的 下 界 。 可 以 证 
明 ， 存 在 与 这 个 下 界 匹配 的 算法 。8.1 节 通过 给 出 分 布 式 计算 行为 模型 ， 形 式 化 地 引入 问题 ， 
并 给 出 下 界 和 扩散 过 程 。8.2 节 提出 了 基于 维持 进程 树 (或 森林 ) 的 解决 方法 ， 至 少 包括 仍 在 
计算 的 所 有 进程 。 本 节 的 解决 方法 并 不 是 很 难 ， 并 与 8.1 节 的 下 界 匹 配 。 前 两 节 包 括 所 有 涉及 
终止 检测 算法 存在 性 和 复杂 度 的 一 些 基本 结果 。 由 于 种 种 原因 ， 一 种 终止 检测 算法 可 能 比 另 
一 种 终止 检测 算法 更 适合 于 某 种 特定 应 用 。 因 此 ，8.3 节 和 8.4 节 提出 了 许多 其 他 解决 方法 。 


8.1 预备 知识 
8.1.1 定义 
本 节 将 定义 分 布 式 计算 模型 ， 它 处 理 分 布 式 计算 的 终止 问题 。 该 模型 由 第 2 章 的 模型 导出 。 
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但 是 忽略 了 与 终止 问题 不 相关 的 所 有 问题 。 

把 进程 p 的 状态 集合 Zs 分 成 两 个 子 集合 ， 活 动 状态 的 进程 集合 与 被 动 状 态 的 进程 集合 。 
如 果 p 的 内 部 事件 或 者 发 送 事件 在 cy 中 是 可 应 用 的 ， 则 称 p 的 状态 cp 是 活动 的 。 否 则 称 p 的 状态 
Co 是 被 动 的 。 在 处 于 被 动 状态 cp 时 ， 仅 有 接收 事件 是 可 应 用 和 的， 或 者 根本 没有 事件 是 可 应 用 
的 ， 在 这 种 情况 下 ，c, 是 p 的 终止 状态 。 如 果 进 程 p 处 于 活动 状态 ， 则 称 它 是 活动 的 ， 否 则 称 
为 被 动 的 。 显 然 、 消 息 只 能 由 活动 进程 发 送 。 仅 当 被 动 进程 接收 消息 之 后 ， 才 能 变 成 活动 进 
程 。 当 活动 进程 进入 被 动 状态 时 ， 它 就 变 成 被 动 的 。 为 了 简化 本 章 的 算法 描述 ， 我 们 做 出 一 
些 假设 。 

(1) 仅 当 在 内 部 事件 内 ,活动 进程 才 变 成 被 动 的 。 可 以 容易 地 修改 进程 满足 这 个 假设 。 
it (c, m, d) 是 p 的 发 送 (或 接收 ) 事件 ， 其 中 d 是 被 动 状态 。 用 (c，m，d') 代替 p 中 的 这 
个 事件 。 其 中 4d' 是 新 的 状态 ， 在 d' 中 惟一 可 应 用 的 事件 是 内 部 事件 (4d'，4d)。 因 为 4' 是 处 于 活 
动 状态 ， 在 内 部 事件 (d', d) 中 ，p 变 成 被 动 的 。 - 

(2) 当 接 到 消息 时 ， 进 程 总 是 变 成 活动 的 。 可 以 容易 地 修改 进程 来 满足 这 个 假设 。 设 (c, 
m, d) 是 p 中 的 接收 事件 ， 其 中 4 处 于 被 动 动态 。 用 (c, m, d') 代替 p 中 的 这 个 事件 。 其 中 
是 新 的 状态 ， 在 4d' 中 惟一 可 应 用 的 事件 是 内 部 事件 (ad'，d)。 因 为 4' 是 一 个 活动 状态 ，p 在 接 
收 事件 后 ， 变 成 活动 状态 ; 在 它 的 下 一 个 事件 (d, d) 后 ，p 变 成 被 动 状 态 。 

(3) p 变 成 被 动 的 内 部 事件 是 p 的 惟一 内 部 事件 。 内 部 事件 中 ， 忽 略 了 p 从 一 种 活动 状态 到 
另 一 种 活动 状态 的 转移 。 因 为 终止 检测 算法 一 定 是 忘记 了 ， 不 允许 利用 进程 的 局 部 计算 是 如 
何 进 行 的 信息 ， 因 而 对 于 终止 检测 算法 而 言 ， 所 有 活动 进程 都 是 相同 的 。 


var statep : (active, passive) ; 


Sp: { statep = active } 
begin send (mes) end 


R,: { A message (mes) has arrived at p } 
begin receive (mes) ; statep :+ active end 


Ip: { state, = active } 
begin state, := passive end 


图 8-1 基本 的 分 布 式 算法 


在 p 的 状态 中 ， 惟 一 有 关 的 是 进程 的 活动 状态 和 被 动 状态 。 用 变量 state, 表 示 。 图 8-1 所 示 
的 算法 中 给 出 了 计算 中 的 所 有 转移 。 通常， 假设 初始 配置 没有 消息 传输 。 初 始 时 ， 进程 可 以 
是 活动 的 也 可 以 是 被 动 的 。 

为 了 区 别 这 个 算法 与 终止 检测 算法 ， 常 常 称 这 个 算法 为 基本 算法 ， 称 它 的 计算 为 基本 计 
蔓 或 者 基础 计算 。 称 终止 检测 算法 为 控制 算法 或 者 妥 加 算法 。 称 它 的 计算 为 控制 计算 或 者 要 
加 计算 。 同 样 ， 相 应 的 消息 称 为 基本 消息 或 者 控制 消息 。 

如 果 在 每 个 配置 中 ， 不 存在 基本 计算 事件 是 可 应 用 的 ， 则 定义 谓词 term 为 真 。 按 照 下 列 
定理 ， 如 果 所 有 进程 状态 是 被 动 的 ， 并 且 没 有 基本 消息 在 传输 中 ， 指 的 就 是 这 种 情况 。 

定理 8.1 term 人 (Vp EP: state, = passive) A (WpqG& E: Mp T & 4 <mes> 消息 )。 

证 明 。 如 果 所 有 进程 处 于 被 动 状态 ， 则 不 存在 内 部 事件 或 者 发 送 事 件 是 可 应 用 的 。 此 外 ， 
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如 果 没 有 一 个 信道 包含 <mes> 消 息 ， 就 不 会 有 接收 事件 是 可 应 用 的 ， 因 此 根本 没有 基本 事件 
是 可 应 用 的 。 

如 果 某 些 进 程 是 医 动 的 ， 则 在 那个 进程 中 可 能 存在 发 送 事件 或 者 内 部 事件 。 如 果 某 些 信 
道 包 含 <mes> 消 息 ， 则 消息 的 接收 是 可 应 用 的 。 

在 基本 算法 的 终止 配置 中 ， 每 个 进程 等 待 接收 消息 ， 并 一 直 保 持 等 待 状态 。 本 章 中 讨论 
的 问题 是 把 控制 算法 加 入 到 系统 中 的 问题 ， 在 基本 计算 到 达 终 止 配置 后 ， 系 统 使 进程 进入 终 
止 状态 。 对 于 组 合算 法 (基本 算法 加 上 控制 算法 )， 满 足 term 的 配置 未 必 是 终止 的 。 总 之 ， 控 
制 算 法 中 会 有 可 应 用 的 事件 。 控 制 算 法 交换 (控制 ) 消息， 这 些 消 息 可 由 被 动 进程 发 送 ， 当 
它们 被 接收 时 ， 不 会 使 得 被 动 进 程 变 成 活动 进程 。 

控制 算法 由 终止 检测 算法 和 终止 发 布 算法 组 成 。 终 止 检测 算法 调用 Announce ， 这 个 发 布 
算法 使 得 进程 进入 终止 状态 。 检 测算 法 必须 满足 以 下 三 个 要 求 : 

(1) 非 干扰 性 检测 算法 不 能 影响 基本 算法 的 计算 。 

(2) 活动 性 ”如果 term 成 立 ， 必 须 在 有 限 步 内 调用 Announce。 

(3) 安全 性 如 果 调 用 Announce， 配 置 必须 满足 term。 

终止 检 而 问题 首先 是 由 Francez[Fra80] 提 出 的 。EFrancez 提 出 了 一 -种 解决 方法 ， 它 不 满足 非 干 
扰 性 。 方 法 通过 阻塞 所 有 事件 ,“ 冷 浆 ” 基 本 计算 ， 然 后 检查 配置 ， 看 它 是 否 终止 。 如 果 终 止 ， 
则 调用 Announce; 否则 , “解冻 ”基本 计算 ， 稍 后 重复 这 一 过 程 。 上 述 提 到 的 要 求 不 包括 这 种 
解决 方法 ， 即 ， 执 行 基本 计算 时 ， 检 测算 法 不 工作 。 在 本 章 的 终止 检测 正确 性 证 明 中 ， 并 不 涉 
及 非 干 扰 性 ， 这 是 因为 从 算法 的 描述 中 ， 显 然 满足 这 一 要 求 。 

如 果 在 每 一 个 初始 状态 ， 只 有 一 个 活动 进程 ， 称 基本 计算 是 集中 式 的 。 如 果 在 每 一 个 初 
始 配 置 ， 有 任意 多 个 活动 进程 ， 则 称 基本 计算 是 分 散 式 的 。 通 常 在 关于 终止 检测 的 文献 中 ， 
称 集中 式 基本 计算 为 扩散 计算 (diffusing computation )。 如 果 在 控制 计算 中 有 一 个 特殊 的 进程 ， 
如 果 进 程 都 只 执行 同一 个 控制 算法 ， 称 控制 计算 是 分 散 式 的 。 


8.1.2 两 个 下 界 


终止 检测 算法 的 复杂 度 可 用 基本 计算 中 所 用 的 参数 N、IEI 和 交换 的 消息 数 M 表 示 。 终 止 检 
测 的 复杂 度 还 与 执行 波动 算法 的 开销 有 关 。 设 W 表 示 最 好 波动 算法 的 复杂 度 。W 与 所 考虑 的 网 
络 特 征 有 关 ， 例如， 是 否 领导 人 可 用 ， 网 络 拓扑 结构 ， 以 及 假设 的 进程 初始 知识 。 

可 以 表明 ， 对 于 集中 式 计 算 和 分 散 式 计算 ， 它 们 的 终止 检测 在 最 坏 情况 下 的 复杂 度 相同 ， 
都 为 下 界 M。 可 以 证 明 ， 对 于 集中 式 基 本 计算 ， 其 终止 检测 的 复杂 度 具 有 下 界 W。 在 本 小 节 最 
后 ， 讨 论 Chandrasekaran 和 Venkatesan 给 出 的 IEI| 条 消息 的 下 界 。 

定理 8.2 对 于 每 个 终止 检测 算法 ， 存 在 一 个 基本 计算 ， 交换 M 条 基本 消息 ， 并 且 在 这 个 
基本 计算 中 ， 检 测算 法 至 少 交换 MM 条 控制 消息 。 

证 明 。 如 果 系 统 能 够 达到 一 个 配置 状态 ， 在 这 个 配置 中 ， 控 制 算法 可 能 交换 无 限 多 的 控 
制 消息 ， 而 不 出 现 一 个 基本 事件 。 结 果 平 凡 成 立 。 在 证 明 的 其 余部 分 ， 假 设 控制 算法 只 与 每 
个 基本 事件 中 的 有 限 条 消息 作用 。 

设 Y 是 一 个 配置 ， p、g 是 其 中 的 两 个 活动 进程 ， 且 没有 消息 在 传输 中 。 如 果 基 本 算法 是 
集中 式 的 ， 从 初始 配置 交换 一 条 基本 消息 ， 就 可 达到 这 个 配置 ; 否则 ， 这 个 配置 中 包含 初始 
配置 。 
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首先 考虑 从 配置 y 开 始 的 计算 ,两 个 进程 同时 变 成 被 动 的 ， RAE = 1, (1, (7Y))。 
在 有 限 步 内 必须 检测 出 终止 性 ， 但 是 p 或 g 在 没有 接 到 来 自 其 他 进程 的 第 一 条 消息 之 前 ， 都 不 
能 调用 Announce。 否 则 ， 就 会 在 配置 中 错误 地 检测 出 终止 ， 而 此 时 其 他 进程 仍 处 于 活动 状态 。 
(如 果 第 三 个 进程 检测 出 终止 性 ， 则 至 少 需要 两 条 消息 . ) 因此 ， 在 检测 出 终止 之 前 ， 在 配置 5 
中 至 少 交 换 一 条 控制 消息 。 

不 失 一 般 性 ， 假 设 p 在 配置 中 将 发 送 控 制 消 息 。 考 虑 从 Y 开 始 的 计算 ， 只 有 p 变 成 被 动 的 ， 
即 系统 到 达 配 置 y, = I, (7Y)。p 的 状态 与 配置 %, 和 6 中 的 状态 相同 。 因 此 ，p 在 配置 y, 中 也 发 送 控 
制 消息 。 接 着 控制 算法 会 有 更 多 的 行为 ， 但 这 并 不 导致 检测 ， 因 为 4 仍然 是 活动 的 。 控 制 算 法 
停止 交换 消息 之 后 ，9 向 p 发 送 一 条 基本 消息 ， 并 返回 到 p 、g 都 为 活动 的 配置 。 接 着 又 有 更 多 
的 控制 活动 ， 但 在 经 过 有 限 步 后 ， 再 次 达到 p 、g 都 为 活动 的 配置 。 并 且 没 有 消息 在 传输 中 。 
总 之 ， 

(1) 从 初始 配置 开始 ， 至 多 交换 一 条 基本 消息 ， 就 可 达到 p、gq 都 为 活动 ， 且 没有 消息 在 
传输 中 的 配置 ; 

(2) 基本 算法 通过 交换 一 条 消息 ， 并 人 迫使 控制 算法 至 少 交换 一 条 控制 消息 ， 可 以 从 一 个 
这 样 的 配置 转移 到 另 一 个 配置 ; 且 

(3) 如 果 基 本 计算 在 这 个 配置 后 终止 ， 为 了 检测 出 这 个 终止 性 ， 至 少 交 换 一 条 控制 消息 。 

这 就 蕴含 着 结果 。 

定理 8.3 检测 分 散 式 基本 计算 的 终止 性 在 最 坏 情况 下 ， 至 少 需要 交换 多 条 控制 消息 。 

证 明 。 考 虑 不 交换 任何 消息 的 基本 计算 。 其 中 每 个 活动 进程 在 它 的 第 一 次 事件 中 变 成 被 
动 状态 。 如 果 认 为 检测 (调用 Announce) 就 是 判定 ， 这 个 基本 计算 要 求 检测 算法 就 是 波动 算 
法 。 的 确 ， 必 须 在 有 限 步 内 调用 Announce， 这 证 明了 检测 算法 可 以 自身 终止 和 判定 。 如 果 判 
定 不 能 由 某 些 进程 4 的 一 个 事件 进行 ， 就 要 考虑 另 一 个 基本 计算 ， 其 中 4 还 没有 变 成 被 动 状态 。 
判定 在 因果 关系 上 并 不 依赖 于 4 中 的 任 一 事件 ， 因 此 在 9 仍然 是 医 动 时 ， 判 定 算法 可 能 错误 地 
调用 Announce。 因 为 检测 算法 是 一 次 波动 ， 因 此 它 至 少 交 换 W 条 消息 。 口 

检测 算法 的 开始 Chandrasekaran 和 Venkatesan[CV90] 在 以 下 两 个 假设 条 件 下 ， 得 出 了 IEI 
条 控制 消息 的 下 界 。 

Ci 信道 是 fifo。 

C2 基本 计算 开始 后 的 任 一 时 间 ， 终 止 检 测算 法 可 能 开始 它 的 执行 ， 即 在 基本 计算 的 任 

一 配置 中 。 

在 这 些 假设 条 件 下 ， 如 果 检 测算 法 并 没有 通过 某 一 条 特定 的 边 ， 如 ，pg 发 送 控制 消息 ， 
就 可 能 进行 不 正确 的 检测 。 正 好 在 检测 算法 开始 之 前 ， 基 本 计算 经 由 信道 pg 发 送 了 一 条 附加 
消息 ; 而 控制 算法 没有 看 到 这 条 消息 ， 由 此 导致 不 正确 检测 。Chandrasekaran 和 Venkatesan 的 
算法 经 由 每 条 信道 发 送 控制 消息 ， 因 此 ， 他 们 的 算法 使 得 在 控制 算法 开始 之 前 发 送 的 所 有 消 
息 ， 在 检测 发 生 之 前 都 被 接收 。 

类 似 于 [CV90] 中 的 讨论 ， 如 果 假 设 C2 有 效 ， 而 Cl 无 效 ， 可 以 证 明 该 问题 可 能 根本 无 解 。 
本 章 假设 控制 算法 在 基本 计算 的 初始 配置 中 开始 ， 即 ， 在 控制 算法 开始 之 前 ， 基 本 计算 不 执 
行 未 得 到 通知 的 事件 。 如 果 用 假设 C2 代 赫 这 个 假设 ,问题 有 解 ， 当 上 生 仅 当 信 道 是 fifo 的 ， 在 这 
种 情形 下 ，[CV90] 给 出 了 问题 的 解 。 
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8.1.3 终止 进程 


为 了 把 终止 消息 发 布 到 所 有 进程 中 ， 需 要 将 <stop> 消 息 扩 散 到 所 有 进程 中 。 每 个 进程 局 
部 调用 Announce， 或 一 旦 接 到 第 一 条 <stop> 消 息 ， 就 向 其 所 有 近邻 发 送 这 条 消息 ， 但 至 多 发 
送 一 次 。 如 果 进 程 接 到 来 自 每 个 近邻 的 <stop> 消 息 ， 就 执行 语 名 stop， 引 起 进程 进入 终止 状 
态 。 图 8-2 所 示 的 算法 给 出 了 发 布 过 程 。 

图 8-2 所 示 的 算法 可 用 于 任意 连通 的 拓扑 结构 ， 包 括 有 向 网 ， 不 需要 领导 人 ， 不 需要 进程 
标识 ， 根 本 不 需要 网 络 拓扑 结构 知识 。 


var SentStop,  : boolean init false ; 
RecStop, : integer init 0; 


Procedure Announce: 
begin if not SentStop, then 
begin SentStop, := true ; 
forall q € Out, do send (stop) to q 
end 
end 


{ A (stop) message has arrived at p } 
begin receive (stop) ; RecStop, := RecStop, +1 ; 
Announce ; 
if RecStop, = #In, then halt 
end 





图 8-2 发 布 算法 


8.2 计算 树 和 森林 


本 节 描 述 的 问题 解 ， 是 基于 动态 地 维持 有 向 图 。 这 个 有 向 图 也 称 为 计算 图 (computation 
graph)。 在 这 个 图 中 的 节点 ， 包 括 了 所 有 活动 进程 ， 以 及 所 有 传输 中 的 基本 消息 。 当 计算 图 
变 为 空 时 ， 进 行 终止 检测 。 本 节 的 解决 方法 网 络 要 求 是 无 向 的 ， 即 ， 消 息 可 以 通过 每 个 信道 
在 两 个 方向 发 送 。8.2.1 人 小节 描述 了 集中 式 基 本 计算 的 一 种 方法 ， 其 中 计算 图 是 一 棵 以 初始 进 
程 为 根 的 树 。8.2.2 小 节 概 述 了 分 散 式 基本 计算 的 一 种 方法 ， 其 中 计算 图 是 森林 ， 其 中 基本 计 
算 的 每 个 初始 进程 为 树 的 根 。 


8.2.1 Dijkstra-Scholten 算 法 


Dijkstra-Scholten 算 法 [DS80] 检 测 集 中 式 基本 计算 的 终止 性 (在 DS[80] 中 称 为 扩散 计算 )。 
基本 计算 的 初始 进程 p。( 在 DS[80] 中 称 为 环境 ) 在 检测 算法 中 起 着 特殊 的 作用 。 

检测 算法 动态 地 维持 一 棵 计算 树 7= (Vr, Er), RAPER. 

(1) 或 者 7 为 空 ， 或 者 7 是 一 棵 根 为 po 的 有 向 树 。 

(2) 集合 Vr 包 括 所 有 活动 进程 ， 以 及 传输 中 的 所 有 基本 消息 。 

当 po É V 时 ， 初 始 进程 Po 调用 Announce。 由 第 一 条 性 质 ， 在 这 种 情形 下 ，7 为 空 。 由 第 二 
条 性 质 ，term 成 立 。 

在 基本 计算 进行 时 ， 为 了 保持 计算 树 的 性 质 ， 当 发 送 一 条 基本 消息 ， 或 者 不 在 树 中 的 进 
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程 变 成 活动 时 ， 必 须 对 7 进行 扩展 。 当 P 发 送 基本 消息 <mes> 时 ， 则 <mes> 被 插入 到 树 中 ， 且 
<mes> 的 父 节 点 为 p。 当 不 在 树 中 的 进程 p， 由 于 接 到 来 自 进程 9 的 消 息 变 成 活动 时 ，4 成 为 p 的 
父 节 点 。 为 了 显 式 地 表示 消息 的 发 送 者 ， 用 <mes，4> 表 示 4 所 发 送 的 基本 消息 <mes>。 

因为 两 个 原因 ， 需 要 从 7 中 删除 节点 。 首 先 ， 当 接 到 一 条 基本 消息 时 ， 将 它 删除 。 其 次 ， 
为 了 保证 检测 算法 的 进行 ， 在 终止 后 的 有 限 步 内 ， 树 必须 解体 。 消 息 是 7 中 的 叶 节点 。 进 程 维 
持 一 个 变量 ， 该 变量 对 进程 在 7 中 的 子 节点 数 进行 计数 。 对 进程 p 的 子 节 点 的 删除 出 现在 另 一 
进程 4 中 ; 它 或 者 是 对 子 节 点 消息 的 接收 ， 或 者 是 对 子 进程 9 的 删除 。 为 了 防止 对 p 的 已 删除 子 
节点 的 计数 ， 当 删除 p 的 子 节点 时 ， 可 向 p 发 送信 号 消息 <sig，p>。 这 个 消息 代替 了 p 中 已 被 删 
除 的 子 节 点 ， 它 的 删除 ， 即 ， 它 的 接收 出 现在 进程 p 中 ， 当 进程 p 接 到 该 信号 消息 时 ， 会 减少 
子 节 点 的 计数 。 











var statep : (active, passive) init if p = po then active else passive ; 
5Cp : integer init 0; 
father, : P init if p = po then p else udef ; 






Sp: { state, = active } 
begin send (mes, p) ; scp := scp + 1 end 






Rp: { A message (mes, q) has arrived at p } 
begin receive (mes, q) ; state, := active ; 
if father, = udef then father, := q else send (sig,q) toq 







end 









Ip: { state, = active } 
begin state, := passive ; 
if scp = 0 then (* Delete p from T *) 
begin if father, = p 
then Announce 
else send (sig, father, ) to father, ; 


father, := udef a 








end 






end 










Ap: { A signal (sig, p) arrives at p } 
begin receive (sig, p) ; scp := scp —1; 
if scp = 0 and state, = passive then 
begin if father, = p 
then Announce 
else send (sig, father, ) to father, ; 
father, := udef 








end 





图 8-3 DUKSTRA-SCHOLTEN 算 法 


图 8-3 所 示 的 算法 给 出 了 这 个 算法 。 每 个 进程 p 有 变量 father,， 如 果 p E Vr, 则 fazher, 为 
udef; 如 果 p 是 根 ， 则 father, 为 p; 如 果 p 是 7 中 非 根 节点 ， 则 father, 为 p 的 父 节 点 。 变量 sc, 给 出 
了 7 中 p 的 子 节 点 数 。 

产 格 的 正确 性 证 明 表 明 ， 图 7 是 一 棵 树 ， 仅 当 基本 计算 终止 后 ， 这 棵 树 变 为 空 。 对 于 图 8- 
3 所 示 的 算法 的 任 一 配置 y， 定 义 
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Vr={p: father, * udef } U {<mes, p> 在 传输 中 } U {<sig, p> 在 传输 中 } 


Er= { (p, father,): father,+udef ^ father, + p} 
U { (<mes, p>, p): <mes，p> 在 传输 中 } 
U{ (<sig, p>, p): <sig, p> 在 传输 中 } 


由 断言 P 得 出 算法 的 安全 性 ， 如 下 定义 


P= State = active => p€ Vr l (1) 
A (u, v) EEr >uEVr AvE V NP (2) 
A scp=#{v: (v, p) EEr} (3) 
A Vr + Ø= I 是 根 为 po 的 树 (4) 
A (state, = passive A sc,=0) >p€ Vr (5) 


这 个 不 变 式 的 意义 如 下 所 述 。 由 定义 ，7 的 节点 集 包括 所 有 消息 (基本 消息 及 控制 消息 )， 
且 由 式 (1)， 它 也 包括 所 有 活动 进程 。 式 (2) 具有 相当 技术 性 ， 它 阐明 7 的 确 是 图 ， 所 有 边 
都 指向 进程 。 式 (3) 表示 ， 对 每 个 进程 子 节点 的 计数 是 正确 的 。 式 (4) 阐述 了 7 是 一 棵 根 为 
po 的 树 。 式 (5) 用 于 表明 ， 如 果 基 本 计算 终止 ， 树 的 确 解体 。 对 于 正确 性 证 明 ， GR, PA 
SR, father, = p 成 立 ， 仅 当 p = po 时 。 
引 理 8.4 P 是 Dijkstra-Scholten 算 法 的 一 个 不 变 式 。 
证 明 。 初 始 时 ， 对 于 所 有 P + po, father». udef， 有 state, = passive ， 这 就 证 明了 式 (1)。 
同时 ，Er = 名 ,证 明了 式 (2)。 对 于 每 个 p>， 由 于 sc, = 0， 这 表明 ， 满 足 式 (3)。Vr = {po}, 
Er= 名， 因此 了 T 是 一 棵 根 为 po 的 树 ， 这 就 证 明了 式 (4)。Vi 中 的 惟一 进程 是 p。，po 是 活动 的 。 
S: 在 S, 中 没有 进程 变 成 活动 的 ， 也 没有 进程 从 Vy 中 被 删除 ， 因 此 式 (1) 保持 。 
可 应 用 性 的 行为 获 含 着 ， 新 节点 <mes，p> 的 父 节点 p 在 访 中 。 这 证 明了 式 (2) 也 保持 。 
作为 行为 的 结果 ， 用 <mes，p> 扩 展 Vi:， 用 (<mes, p>, p) PRE, XRT 
一 棵 树 ，sc, 正 确 增 加 ， 反 映 p 的 新 增 子 节点 。 因 此 式 (3) 和 式 (4) 保持 。 
在 Vr 中 ， 没 有 进程 变 成 被 动 叶 节点 ， 也 没有 进程 的 插入 。 因 此 式 (5) 保持 。 

R: 或 者 p 已 经 在 Vy 中 (father, + udef), 或 者 p 是 在 行为 中 被 插入 Vi 中 的 ， 因 此 式 (1) 
保持 。 
如 果 对 father, 进 行 赋值 ， 则 它 的 新 值 为 x7， 如果 p 发 送 一 个 信号 ， 则 它 的 父 节点 也 是 gq， 
4 在 太 中 ， 因 此 式 (2) 保持 。 
因为 9 的 子 节点 <mes，4> 或 者 被 子 节点 p 代 替 ， 或 者 被 子 节点 <sig，q> 代 替 ， 因 此 4 的 
子 节点 数 没有 变化 。 因 此 ，sc, 依 然 正 确 ， 式 (3) 保持 。 
图 的 结构 没有 变化 ， 因 此 式 (4) 保持 。 
任何 情形 的 行为 后 ， 进 程 p 在 Vy 中 。 因 此 式 (5) 保持 。 

使 得 p 变 成 被 动 状态 ,保持 式 (1)、 式 (2)、 式 (3) MÈ (4)。p 以 前 是 活动 的 ， 草 
含 着 p 在 Vr 中 。 如 果 sc, = 0，p 被 从 VV 中 删除 ， 因 此 式 (5) 保持 。 
下 面 考虑 ， 如 果 从 7 中 删除 p， 会 发 生 什 么 情况 。 即 ， 如 果 p 成 为 T 中 的 被 动 叶 节点 。 
如 果 p 发 送 一 个 信号 ， 则 信号 的 父 节 点 是 p 中 最 近 父 节点 ， 它 在 Vz 中 。 因 此 式 (2) 保 
持 。 在 这 种 情形 下 ， 信 号 代替 p 作 为 father, 的 子 节点 ， EEs Caner RIEM, R (3) 
保持 。 图 的 结构 未 变 。 因 此 式 (4) 保持 。 
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AM, father, = pHK, p = po 且 p 是 叶 节 点 ， 这 更 含 着 p 是 7 中 惟一 的 节点 ， 它 的 
删除 使 得 7 为 空 ， 因 此 式 (4) 保持 。 

A,: 信号 的 接收 使 得 pz 的 子 节点 数 减 1， 对 scr* 的 赋值 使 得 式 (3) 保持 。 那 个 p 是 信号 的 父 

节点 纺 含 着 ，p 在 Vr 中。 如 果 state, = passive 且 在 接收 后 sc, = 0 成 立 ， 则 p 被 删除 ， 因 
此 式 (5) 保持 。 
如 果 从 Vr 中 删除 p， 不 变 式 保持 ， 证 明 同 行为 I。 

“定理 8.5 Dijkstra-Scholten 算 法 (图 8-3 所 示 的 算法 ) 是 正确 的 终止 检测 算法 ， 利 用 MM 条 控 
制 消息 。 

证 明 。 定 义 $ 为 所 有 子 节点 计数 的 和 ， als = Scr). 初始 时 ，$ 为 0。 当 发 送 基 本 消息 时 
(在 S; 中 )，5 增 加 。 当 接 到 控制 消息 时 (EA), Sho AR (3), SARAT. RASE 
在 任何 计算 中 ， 控 制 消息 数 从 不 会 超过 基本 消息 数 。 

为 了 证 明 算 法 的 活动 性 ， 假 设 基本 计算 已 经 终止 。 终 止 后 ， 只 有 行为 A, 能 够 发 生 ， 因 为 
在 每 次 这 样 的 迁移 中 ，5 减 1， 算 法 达到 终止 状态 。 观 察 这 样 的 配置 中 ，V; 不 含 消息 。 且 由 式 
(5)，YV7z 不 含 被 动 叶 节点 。 因 此 ，7 不 含 叶 节点 ， 这 蕴含 着 7 为 空 。 当 mo 删除 自身 时 ， 树 变 为 空 。 
在 这 一 步 中 ， 程 序 满 足 ，Po 调 用 Announce。 

为 了 证 明 安 全 性 ， 注 意 只 有 po 调用 Announce。 当 它 从 Vr 中 删除 自身 时 ， 才 调用 Announce。 
由 式 (4)， 当 发 生 这 种 情形 时 ，7 为 空 ， 这 更 含 着 term 成 立 。 口 

Dijkstra-Scholten 算 法 在 控制 通信 和 基本 通信 方面 ， 达 到 了 很 好 的 平衡 。 对 于 p 向 4 发 送 的 
每 一 个 基本 消息 ， 算 法 中 4 只 向 p 发 送 一 次 控制 消息 。 控 制 通信 等 于 定理 8.2 中 给 出 的 下 界 ， 因 
此 对 于 集中 式 计 算 的 终止 检测 ， 算 法 达到 了 最 坏 情 况 下 的 最 优 算法 。 

在 本 小 节 的 描述 中 ， 所 有 消息 显 式 地 携带 父 节 点 。 但 是 没有 必要 这 样 做 ， 因 为 基本 (或 
者 控制 ) 消息 的 父 节 点 总 是 它 的 发 送 者 (或 者 目的 地 )。 


8.2.2 Shavit-Francez 算 法 

















Shavit-Francez 将 Dijkstra-Scholten 算 法 推广 到 分 散 式 基本 计算 上 [SF86]。 在 它们 的 算法 中 ， 
计算 图 是 森林 ， 其 中 每 棵 树 以 基本 计算 的 初始 进程 为 根 。 以 p 为 根 的 树 用 7 表示 。 

RIRE EF = (Ve, Er), WE (1) 或 者 F 为 空 ， 或 者 F 是 森林 ， 其 中 的 每 棵 树 以 初始 进 
BAR, (2) Vr 包括 所 有 活动 进程 和 所 有 基本 消息 。 正 如 在 Dijkstra-Scholten 算 法 中 所 作 的 
那样 ， 当 图 变 空 时 ， 进 行 终止 检测 。 令 人 遗憾 的 是 ， 在 森林 的 情形 下 ， 不 容易 看 出 图 是 否 为 
空 。 确 实 ， 以 po 为 根 的 计算 树 的 性 质 蕴含 着 ，po 观 测 树 是 否 为 空 ， 当 树 为 空 时 ， 它 调用 
Announce。 在 森林 的 情形 ， 每 个 初始 进程 只 观察 自己 所 属 树 的 是 否 为 空 ， 但 是 这 并 不 蕴含 森 

可 用 一 次 波动 来 验证 所 有 树 已 经 解体 。 维 持 森 林 具 有 另 一 个 性 质 ， 就 是 如 果树 T, 变 为 空 ， 
此 后 都 为 空 。 注 意 这 样 并 不 能 防止 p 变 成 活动 状态 ,但 如 果 在 它 的 树 解体 之 后 ，p 变 成 活动 的 ， 
它 被 插入 到 另 一 个 初始 进程 的 树 中 。 仅 当 它 的 树 解体 时 ， 每 个 进程 参加 波动 。 当 波动 判定 时 ， 
调用 Announce。( 如 果 所 选 的 波动 算法 在 每 个 进程 中 产生 一 次 判定 ， 调 用 Announce 是 多 余 
的 ; 在 这 种 情况 下 ， 在 判定 和 完成 波动 算法 之 后 ， 进 程 简单 地 终止 。) 

图 8-4 给 出 了 这 个 算法 ， 其 中 没有 显 式 地 给 出 波动 算法 。 每 个 进程 p 有 一 个 变量 father,， 
如 果 p 括 Ve， 则 father。 为 udef， 如 果 p 是 根 ， 则 farher, 为 p; 如 果 p 是 F 中 非 根 节点 ， 则 farher, 为 
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Pp 的 父 节点 。 变 量 sc, 给 出 F 中 p 的 子 季 点 数 。 布 尔 变 量 empty, 为 真 ， 当 且 仅 当 p 的 树 为 空 。 


var state, : (active, passive) init if p is initiator then active else passive ; 
5Cp : integer init 0 ; 
father, : P init if p is initiator then p else udef ; 
empty, : boolean init if p is initiator then false else true ; 


Sp: { statep = active } 
begin send (mes, p) ; scp := scp + 1 end 


R,: { A message (mes, q) has arrived at p } 
begin receive (mes, q) ; state, := active ; 
if father, = udef then father, := q else send (sig,q) to q 
end 


Ip: { statep = active } 
begin state, := passive ; 
if scp = 0 then (* Delete p from F *) 
begin if father, = p 
then empty, := true 
else send (sig, father, ) to father, ; 
father, := udef 
end 
end 


Ap: { A signal (sig,p) arrives at p } 
begin receive (sig, p) ; scp := scp ~ 1; 
if scp = 0 and state, = passive then 
begin if father, =p 
then empty, := true 
else send (sig, father, ) to father, ; 
father, := udef 
end 
end 


进程 并 发 地 执行 波动 算法 ， 其 中 ， 仅 当 empty 为 true 时 ，p 发 送 或 者 判定 ; decide 调 用 Announce。 





图 8-4 Shavit-Francez 算 法 


算法 的 正确 性 证 明 类 似 于 Dijkstra-Scholten 算 法 的 证 明 。 对 于 图 8-4 所 示 的 算法 的 任 一 配置 
Y， 定 义 


Ve={p: father, + udef } U {<mes, p> 在 传输 中 } U {<sig, p> 在 传输 中 } 


且 


Er= { (p, father,): father, + udef A father, + p } 
U { (<mes, p>, p): <mes，p> 在 传输 中 } 
U { (<sig, p>, p): <sig，p> 在 传输 中 } 


由 断言 @ 得 出 算法 的 安全 性 ， 如 下 定义 。 它 是 算法 的 不 变 式 。 不 变 式 的 证 明 类 似 于 引 理 
8.4 的 证 明 。Q@ 的 式 (1) 到 式 (5) 的 意义 与 Dijkstra-Scholten 算 法 中 的 不 变 式 相同 。 式 (6) 
表示 ， 每 个 进程 正确 地 记录 了 是 否 它 仍然 是 森林 中 树 的 根 。 当 然 ， 如 果 没 有 一 个 进程 为 树 的 
根 ， 则 森林 为 空 。 
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Q<= state, = active =p €E Vp (1) 
A (u, v) EE >uEVp AVEVe NP (2) 
A scp=#{v: (v, p) EEr} (3) 
A Vr * Ø => FERI (4) 
A (state, = passive A sc,=0) = p€ Vr (5) 
A empty, se T, 3% (6) 


引 理 8.6 @ 是 Shavit-Francez 算 法 的 一 个 不 变 式 。 

证 明 。 初 始 时 ， 对 于 每 个 非 初 始 进程 P，state = passive， 对 于 每 个 初始 进程 p, father, =p, 
这 证 明了 式 (1). 并且 E: = 多 ,证 明了 式 (2)。 对 于 每 个 p，sc, = 0， 这 表明 , 式 (3) 被 满足 。 
Ve={p: p 是 初始 进程 ;}，E# = 如， 因此 F 是 由 一 个 节点 的 树 组 成 的 森林 ， 每 棵 树 由 初始 进程 构 
成 。 这 就 证 明了 式 (4)。V: 中 的 进程 是 初始 进程 ， 它 们 是 活动 的 ， 这 就 证 明了 式 (5)。 初 始 
时 ，empty, 相 等 (p 是 非 初始 进程 )， 且 7, 为 空 ， 当 且 仅 当 p 不 是 初始 进程 ， 这 就 证 明了 式 (6)。 


S,: 


> 
` 


在 $, 中 没有 进程 变 成 活动 的 ， 也 没有 进程 从 Vr 中 被 删除 ， 因 此 式 (1) 保持 。 
行为 的 可 应 用 性 蕴含 着 ， 新 节点 的 父 节点 p 在 Yr 中 。 这 证 明了 式 (2) 也 保持 。 

作为 行为 的 结果 ,用 <mes，p> 扩 展 V:， 用 (<mes, p>, p) 扩展 E:， 这 表明 FF 仍然 是 
森林 ，sc, 正 确 地 增加 ， 反 映 p 的 新 增 子 节点 。 因 此 式 (3) MR (4) 保持 。 

在 V: 中 ,没有 进程 变 成 被 动 叶 节 点 ， 也 没有 进程 的 插入 。 因 此 式 (5) 保持 。 

当 新 叶 节 点 被 加 入 到 非 空 树 中 ， 不 存在 树 变 成 非 空 树 、 因 为 empty 变 量 不 变 ， 因 此 式 
(6) 保持 。 


: 或 p 已 经 在 Ve 中 (father。 + udef)， 或 在 行为 中 p 被 插入 ， 因 此 式 (1) 保持 。 


如 果 对 fathers 进 行 赋值 ， 则 它 的 新 值 为 xs， 如 果 p 发 送 一 个 信号 ， 则 它 的 父 节点 也 是 gq， 
4 在 Vr 中 ， 因 此 式 (2) 保持 。 

因为 9 的 子 节点 数 <mes，9> 或 者 被 子 节点 p 代 替 ， 或 者 被 子 节点 <sig，4> 代 替 ， 因 此 4 
的 子 节点 没有 变化 。 因 此 scr 依 然 保 持 式 (3) 正确 。 

图 的 结构 没有 变化 ， 因 此 式 (4) 保持 。 

任何 情形 下 ， 不 存在 进程 变 成 被 动 叶 结 点 ， 也 没有 进程 插入 Vs 中 。 因 此 式 (5) 保持 。 
没有 树 变 成 空 或 者 变 成 非 空 ， 因 此 式 (6) 保持 。 


: 使 得 p 被 动 保持 式 (1)、 式 (2)、 式 (3) 和 式 (4)。p 曾 经 是 活动 的 ， 蕴 含 着 p 在 Vr 中 。 


如 果 sc = 0， 从 Vr 中 删除 p， 因 此 式 (5) 保持 。 

下 面 考虑 ， 如 果 将 p 从 F 中 删除 ， 会 发 生 什 么 ?” 即 ， 如 果 p 是 F 中 的 被 动 时 结 点 。 

如 果 发 送 一 个 信号 ， 则 信和 号 的 父 节点 是 p 中 最 后 的 父 节点 ， 它 在 W 中 。 因 此 式 (2) 
保持 。 在 这 种 情形 下 ， 信 号 代 圭 p 作 为 father, 的 子 节点 ， 因此 scnwe, 保 持 正确 , 式 (3) 
保持 。 图 的 结构 未 变 。 因 此 式 (4) 保持 。 否 则 ， 如 果 father, = p 为 真 ，p 是 根 且 p 是 
叶 节 点 ， 这 理 含 着 p 是 7 中 惟一 的 节点 ， 它 的 删除 使 得 7 为 空 ， 对 emptpy, 的 赋值 使 得 
式 (6) 保持 。 


: 信号 的 接收 使 得 p 的 子 节点 数 减 1， 对 sc 的 赋值 使 得 式 (3) 保持 。 那 个 p 是 信号 的 父 


节点 蕴含 着 ，P 在 Vr 中 。 如 果 stare, = passive H 信号 接收 后 sc = 0 成 立 ， 则 p 被 删除 ， 
因此 式 (5) 保持 。 
如 果 从 Ve 中 删除 p， 不 变 式 保持 ， 证 明 同 L。 口 


定理 8.7 Shavit-Francez 算 法 (图 8-4 所 示 的 算法 ) 是 正确 的 终止 检测 算法 ， 利 用 M+ Wk 
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控制 消息 。 

证 明 。 如 同 定理 8.5 的 证 明 ， 信 号 的 数目 从 不 会 超过 基本 消息 的 数目 。 除 了 信号 消息 ， 控 
制 算法 只 为 一 次 波动 发 送 消 息 ， 由 此 可 得 ， 至 多 发 送 M + W 条 控制 消息 。 

为 了 证 明 算 法 的 活动 性 ， 假 设 基本 计算 已 经 终止 。 在 有 限 步 后 ,终止 检测 算法 达到 终止 
配置 。 如 同 定理 8.5 的 证 明 ， 在 这 个 配置 中 ，F 为 空 。 因 此 ， 波 动 中 的 所 有 事件 可 在 每 个 进程 
中 执行 。 配 置 是 终止 的 ,蕴含 着 波动 的 所 有 事件 都 被 执行 ， 至 少 包 括 一 次 判定 ， 它 引起 
Announce 的 调用 。 

为 了 证 明 安全 性 ， 注 意 只 有 在 判定 出 现在 波动 算法 中 时 ， 才 调用 Announce。 这 并 含 着 每 
个 进程 p 已 经 发 送 了 一 次 波动 消息 或 者 已 经 判定 。 当 p 这 样 做 时 ， 算 法 蕴含 着 emprty, 为 真 。 没 
有 行为 再 次 使 得 empiy, 为 假 。 因 此 (对 于 每 个 p) 当 调 用 Announce 时 ，empty, 为 真 。 由 式 (6), 
VA, XS Bterm KI. 口 

Shavit-Francez 算 法 中 交换 的 控制 消息 数 ， 与 定理 8.2 和 8.3 中 证 明 的 下 界 在 数量 级 上 相 匹 
配 。 因 此 对 于 分 散 式 计算 的 终止 检测 (如 果 利 用 最 优 的 波动 算法 )， 算 法 达到 了 最 坏 情况 下 的 
最 优 算法 。 

本 节 中 考 虚 的 算法 要 求 通信 信道 是 双向 的 。 对 于 p 向 g 发 送 的 每 一 条 基本 消息 ， 必 须发 送 
一 条 从 4 到 p 的 信号 。 平 均 情况 下 的 复杂 度 等 于 最 坏 情况 下 的 复杂 度 。 每 次 执行 中 ， 每 条 基本 
消息 需要 一 条 信号 消息 。 在 Shavit-Francez 算 法 的 情形 ， 仅 执行 一 次 波动 算法 。 


8.3 基于 波动 的 方法 


除了 8.2 节 介绍 的 两 个 终止 检测 算法 ， 有 两 个 原因 需要 考虑 其 他 终止 检测 算法 。 首 先 ， 这 
里 给 出 的 算法 只 能 用 于 双向 信道 。 其 次 ， 尽 管 这 些 消 息 的 复杂 度 在 最 坏 情况 下 是 最 优 的 ， 还 
有 一 些 其 他 算法 有 更 好 的 平均 情况 复杂 度 。 每 次 执行 中 ， 前 面 小 节 所 述 算法 利用 最 坏 情况 下 
的 消息 数 。 

本 节 研 究 一 些 基于 反复 执行 波动 算法 的 算法 ， 在 每 次 波动 以 后 ， 或 者 检测 终止 性 ， 或 者 
开始 新 的 波动 。 在 每 个 进程 中 ， 如 果 满 足 局 部 条 件 ， 就 检测 终止 性 。 

首先 考虑 算法 的 具体 实例 。 在 所 有 情形 中 ， 采 用 环 算法 作为 波动 算法 。 并 假定 环 可 以 个 
入 到 网 络 中 ， 作 为 网 络 的 子 拓扑 结构 ， 但 是 对 于 基本 消息 的 交换 并 不 限于 环 中 的 信道 。 进 程 
从 po 到 pw-! 编 号 。 通 过 po 向 pw_1 发 送 令 牌 完成 环 的 初始 化 。 进 程 p;,，( 对 于 i < N-1) 把 令 牌 转发 
给 进程 户 。 当 进程 po 接收 返回 的 令 牌 时 ， 令 牌 遍历 结束 。 

第 一 个 这 类 方法 是 Dijkstra、Feijen 和 Van Gasteren 提 出 的 算法 (8.3.1 小 节 )， 该 算法 检测 
具有 同步 消息 传递 的 计算 的 终止 性 。 还 有 一 些 作 者 将 这 个 算法 推广 到 具有 异步 消息 传递 的 计 
算 上 ， 共 中 的 主要 问题 是 验证 通信 信道 为 空 。 我 们 讨论 了 Safra 提 出 的 方法 (8.3.2 小 节 )， 它 
在 每 个 进程 中 计算 收发 的 消息 数 ， 通 过 比较 消息 数 ， 来 确认 信道 为 空 。 它 也 可 能 利用 确认 机 
fill (8.3.3 小 节 )， 但 是 这 种 方法 再 次 要 求 信 道 是 双向 的 ， 控 制 消息 数 至 少 等 于 Shavit-Francez 
算法 中 所 用 的 消息 数 。 

在 8.3.4 小 节 ， 将 检测 的 一 般 原 理 推广 到 任意 波动 算法 的 使 用 上 。 


8.3.1 Dijkstra-Feijen-Van Gasteren 算 法 





Dijkstra-Feijen-Van Gasteren 算 法 [DFG83] 利 用 同步 消息 传递 (synchronous message 
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passing) 检测 基本 计算 的 终止 性 。 这 种 计算 的 行为 在 算法 8-5 中 给 出 。 在 这 些 计算 中 ， 终 止 用 
以 下 方式 描述 
term = Vp: state, = passive 


将 该 算法 和 term 与 图 8-1 所 示 的 算法 和 定理 8.2 进 行 比较 。 


var state, : (active, passive) ; 


Cp: { state, = active } 
begin (* p sends a basic message, which is received by q *) 


stateg := active 
end 


{ state, = active } 
begin state, := passive end 





图 8-5 具有 同步 消息 的 基本 算法 


算法 由 一 系列 步骤 组 成 。 每 步 易 于 理解 。 由 不 变 式 可 得 算法 的 正确 性 。 这 里 的 处 理 取 自 
文献 [DFG83]。 以 下 ，! 表 示 持 有 令 牌 的 进程 数 ， 如 果 令 牌 在 传输 中 ， 则 传输 令 牌 的 进程 数 是 
动态 的 。 令 牌 只 能 由 进程 p, 转 发 ， 每 次 ! 碱 1。 当 + = 0 时 ， 波 动 结束 。 因 此 ， 选 择 不 变 式 P， 满 
EMP. t= 0 和 po 中 的 其 他 信息 可 推出 终止 性 。 当 po 开始 波动 时 ， 不 变 式 必须 成 立 ， 即 1 = N- 
1 。 

作为 首次 尝试 ， iP = Po, 这 里 


P= Vi (N>i>t): state, = passive 


当 != N-1 时 ，Po 为 真 。 如 果 ! = OH state, = passive ， 由 此 断言 ， 可 推出 终止 性 。 仅 当 只 有 
被 动 进 程 转发 令 牌 时 ， 令 有 牌 的 转发 才 保持 P,。， 因 此 我 们 采用 以 下 规则 。 

规则 1 只 有 进程 处 于 被 动 状态 时 ， 它 才 处 理 令 牌 。 

在 这 种 规则 下 ， 通 过 转发 令 牌 和 内 部 行为 ， 保 持 P。 令 人 遗憾 的 是 ， 通 信行 为 并 不 能 保持 
P。 当 进程 p; 激活 进程 pj 时 ， 其 中 j > t 和 i < e, WP AR; 参见 习题 8.4。 因 为 Po 可 为 假 ， 可 
用 弱 断 言 (Po V Pi) 代 圭 P， 选 择 Pl 使 得 每 次 Po 值 为 假 时 ，P, 为 真 。 我 们 为 每 个 进程 提供 一 
种 颜色 ， 或 为 白色 或 为 黑色 。 设 P= (PoV Pi)， 其 中 ， 

Pis3j(t>j>z0): color, = black 


如 果 发 送 进程 对 自己 着 黑色 ， 则 PP 的 每 个 假 值 ， 保 证 P, 为 真 或 者 变 为 真 。 

规则 2 发 送 进程 变 成 黑色 ， 

因为 (P A color, = white 人 +=0) 一 "Pi， 因 此 用 新 不 变 式 仍然 可 能 检测 终止 性 ， 即 处 
理 令 牌 时 ， 通 过 Po 是 否 是 白色 ( 且 被 动 )， 判 定 终止 性 。 

弱化 P 可 以 防止 通信 使 得 谓词 为 假 的 情况 。 但 是 令 牌 的 转发 可 使 得 弱 断 言 为 假 ， 即 ， 如 果 
进程 :是 惟一 的 黑色 进程 ， 并 转发 令 牌 。 可 以 进一步 弱化 忆 解 决 这 种 情况 。 假 定 令 牌 也 具有 颜 
色 (白色 或 者 黑色 )，P 弱 化 为 (PP V PIV Ps), h 

Py = 令 牌 为 黑色 
如 果 黑 色 进 程 转发 令 牌 ， 令 牌 变 黑 ， 则 令 牌 转发 保持 P,。 
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规则 3 ” 当 黑 色 进程 转发 令 牌 时 (除去 进程 po) ， 令 牌 变 成 黑色 。 

因为 〈 令 牌 为 白色 ) 一 =P,，po 通 过 它 是 否 接 到 白色 令 牌 ( 且 自 己 也 是 白色 ， 并 处 于 被 动 
RÆ), 仍然 可 检测 出 终止 性 。 

现在 可 验证 ， 内 部 行为 、 基 本 通信 以 及 令 牌 转发 保持 P。 变 黑 的 令 牌 引起 不 成 功 波动 
(unsuccessful wave) 现象 ; 如果 返回 令 牌 为 黑色 ，po 不 能 判定 终止 性 ; 如 果 波 动 不 成 功 结束 ， 
则 必须 开始 新 的 波动 。 

规则 4 ” 当 波 动 不 成 功 结束 时 ，po 开 始 新 一 次 波动 。 

如 果 没 有 一 种 方式 使 得 黑色 进程 再 次 变 成 白色 进程 ， 下 次 波动 一 定 会 像 上 次 一 样 不 会 成 
功 。 当 转发 令 牌 时 ， 黑 色 进 程 将 使 得 令 牌 为 墨色， 同样 引起 下 一 次 波动 失败 。 

观察 可 见 ， 如 果 i > !， 变 成 白色 的 进程 P 并 不 使 P 为 假 ， 当 po 向 pw-, 发 送 令 牌 时 ， 开 始 波动 ， 
P 总 是 变 为 真 。 这 蕴含 着 ,一旦 转发 令 牌 ， 变 成 白色 可 以 安全 地 发 生 。 

规则 5 在 发 送 令 牌 之 后 ， 每 个 进程 接着 变 成 白色 。 

在 基本 计算 终止 后 ， 变 成 白色 可 保证 波动 最 终 成 功 。 如 图 8-6 所 示 的 算法 。 


var state, : (active, passive) ; 
color, : (white, black) ; 


Cpa: { statep = active } 
begin (* p sends a basic message, which is received by q *) 
color, := black ; . (* Rule 2 *) 
state; := active 
end 


Ip: { state, = active } 
begin state, := passive end 


Start the detection, executed once by po: 
begin send (tok, white) to py_, end 


Tp: (* Process p handles the token (tok, c} *) 
{ state, = passive} (* Rule 1 *) 
begin if p = po 
then if (c = white A colory = white) 
then Announce 


else send (tok, white) topy_, (* Rule 4 *) 
else if (color, = white) (* Rule 3 *) 
then send (tok,c) to Neztp 
else send (tok, black) to Nezt, ; 
color, := white (* Rule 5 *) 





图 8-6 Dijkstra-Feijen-Van Gasteren 算 法 


定理 8.8 对 于 利用 同步 消息 传递 的 基本 计算 ， Dijkstra-Feijen-Van Gasteren 算 法 (图 8-6 所 
示 的 算法 ) 是 正确 的 终止 检测 算法 。 

证 明 。 谓 词 P= (Po V PIV P;), 设计 算法 满足 ，P 是 算法 的 不 变 式 。 当 处 于 被 动 状态 的 
白色 po 处 理 白色 令 牌 时 ， 检 测 终止 性 。 实 际 上 ， 当 这 种 情况 发 生 时 ， 令 牌 的 颜色 蕴含 着 -P,， 
Po 的 颜色 和 1 = 0 列 含 "-P,， 则 Po 和 zo 的 状态 昔 含 term， 因 此 算法 是 安全 的 。 
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为 了 证 明 活 动 性 ， 假 设 基本 计算 终止 。 从 那 时 起 ， 所 有 进程 无 延迟 地 转发 收 到 的 令 牌 。 
当 令 牌 完成 它 的 首次 完全 巡回 ， 该 巡回 在 终止 后 开始 ， 所 有 进程 为 白色 ; 当 令 牌 完成 它 的 下 
次 巡回 ， 检 测 终止 性 。 口 

现在 估算 算法 中 所 用 的 控制 消息 数 。 对 于 每 两 条 基本 消息 ， 定 理 8.2 证 明 中 所 用 的 基本 计 
算 使 得 算法 至 少 利用 令 牌 的 一 轮 巡回 。 因 此 算法 的 最 坏 情 况 复 杂 度 为 112N . M 条 消息 。 参 见 . 
习题 8.5。 

对 于 “平均 ”基本 计算 ， 算 法 利用 少 得 多 的 消息 。 假 设 基 本 计算 的 时 间 复 杂 度 为 7， 因 为 
令 牌 总 是 顺序 转发 ， 假 设 令 牌 在 基本 计算 终止 之 前 ， 转 发 大 约 7 次 是 合理 的 。( 甚 至 这 种 估算 
可 能 是 太 悲 观 ， 因 为 令 牌 的 转发 在 活动 进程 中 被 挂 起 。) 由 于 终止 后 ， 令 牌 转发 小 于 3N 次 。 
这 种 情况 下 ， 算 法 交换 7+3N 条 控制 消息 。 基 本 计算 的 复杂 度 至 少 为 7 ( 即 ， 它 的 时 间 复 杂 度 )， 
但 是 如 果 计 算 包 含 足够 的 并 行 性 ， 它 的 消息 复杂 度 可 高 达 Q(N . T)。 如 果 并 行 性 允许 每 个 进 
程 每 个 时 间 单 位 发 送 a 条 消息 ， 基 本 计算 的 消息 复杂 度 为 NV. T a， 即 ，Q(N . 7)。 控 制 消息 
数 7 为 O(N + 7 了 )， 这 要 比 终止 检测 问题 期 望 的 最 坏 情况 复杂 度 好 的 多 。 


8.3.2 基本 消息 的 计数 : Safra 算 法 


在 Dijkstra-Feijen-Van Gasteren 算 法 的 基本 计算 中 ， 假 设 同 步 消 息 传递 ， 对 于 它 的 可 应 用 
性 具有 一 般 的 局 限 性 。 几 个 作者 将 这 一 算法 推广 到 具有 异步 消息 传递 的 计算 中 (参见 图 8-1 所 
示 的 算法 )。 本 小 节 将 讨论 Safra 算 法 [Dij87]， 它 的 平均 情况 复杂 度 可 与 Dijkstra-Feijen-Van 
Gasteren 算 法 的 复杂 度 相 比 。 

对 于 每 个 配置 ， 定 义 传输 中 的 消息 数 为 8。 现 在 term 等 价 于 


(Wp: state, = passive) A B=0 
设计 不 变 式 P， WIP, t =0 及 po 中 的 其 他 信息 可 得 出 算法 的 终止 性 。 当 po 开始 波动 时 ， 


即 当 + = N-1 时 ， 不 变 式 成 立 。 为 了 使 得 8 中 的 信息 在 进程 (虽然 是 分 布 式 方式 ) 中 可 用 ， 进 
程 p 中 有 消息 计数 器 mc,， 且 进程 将 P, 作 为 不 变 式 ， 其 中 


Pa = B= SY mc, 
PEP 


初始 时 ， 对 于 每 个 >，mc, = 0， 可 得 不 变 式 P。 进 程 服 从 以 下 规则 。 

规则 M ” 当 发 送 消息 时 ， 进 程 p 增 加 它 的 消息 计数 器 增加 1。 当 接收 一 条 消息 时 ， 进 程 p 的 
消息 计数 器 减少 1 。 

当 进程 Po 接 到 令 牌 (! = 0) 时 ， 不 变 式 必须 允许 Po 判定 term 成 立 。 因 为 term 包 括 对 8 值 的 
限制 ， 可 使 令 牌 携带 整数 q 来 计算 已 经 转发 给 它 的 进程 中 消息 计数 器 的 总 和 。 作 为 首次 尝试 ， 
可 设 P = Pa 人 P。， 其 中 

P, = (Vi(N > i >t): state, = passive) la- mc, 


>i>t 


当 !=N-1，9 = 0 时 ，P 为 真 ， 如 果 != 0， 那 么 P 蓝 含 着 
(vi >0: state, = passive) A (me, +q= B) 


因此 ， 如 果 starten = passive H.mc,, +9g=0。po 可 推出 终止 性 。 
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当 po 通 过 发 送 令 牌 pw-! 且 4 = 0 时 开始 波动 ， 建 立 断 言 Pp。 如 果 只 有 被 动 进程 转发 令 牌 并 增 
加 消息 计数 器 的 值 ， 则 令 牌 的 转发 保持 断言 P。。 因 此 我 们 采用 以 下 规则 。 

规则 1 ” 当 进 程 处 于 被 动 状态 时 ， 只 处 理 令 牌 。 当 进程 转发 令 牌 时 ， 向 q 增 加 消息 计数 器 
的 值 。 在 这 种 规则 下 ， 令 牌 的 转发 和 内 部 行为 使 得 P 保 持 。 遗 憾 的 是 ， 当 进程 p 接 到 消息 的 i > 
上 时， 并 不 能 保持 P。 在 接收 状态 ， 发 生 Po 为 假 。 即 ， 仅 当 > 0， 它 是 可 应 用 的 。 因 为 在 为 假 
Z, PRE RASAP, KP 


P - (Sr, +a) >0 
ust 


当 进 程 p; 接 到 i > ! 的 消息 时 ， 断 言 已 为 真 。 因 此 ， 当 进程 p 接 到 消息 且 > tt, HAP, A 
(PoV Pi) 来 定义 弱 断 言 P。 

修改 过 的 断言 仍然 允许 由 Po 进行 终止 检测 ， 而 条 件 不 变 。 因 为 如 果 ! = 0，P1 读 到 mcp + 4 
>0， 因 此 ， 由 于 mco, +4=0 (这 是 检测 所 要 求 的) ，”P 成 立 。 令 牌 转发 保持 已 ， 基 本 消息 的 


发 送 同样 保持 P!。 但 是 ， 当 进程 p 接 到 i < 的 消息 时 ，P 为 假 。 如 同 在 8.3.1 小 节 ， 可 以 对 每 个 . 


进程 着 色 ， 修 改 本 规则 。 
规则 2 接收 进程 变 成 黑色 。 
FAP,A (PoV P1VP;) 代替 P， 其 中 
已 = 了 ji > j > 0): color, = black 


使 P 为 假 的 每 次 接收 ， 使 P, 为 真 。 因 此 任何 一 次 基本 行为 都 不 会 使 得 P 为 假 。 因 为 (P 人 
color, = white A t= 0) => ~P,， 因 此 用 新 断言 仍然 可 能 检测 终止 性 ， 即 ， 处 理 令 牌 时 ， 通 过 
Po 是 否 是 白色 (Hizi), HEIE. 

弱化 P 可 以 防止 基本 事件 使 谓词 为 假 的 情况 。 但 是 令 牌 的 转发 可 使 得 弱 断 言 为 假 ， 即 ， 如 
果 进 程 : 是 惟一 的 黑色 进程 ， 并 转发 令 牌 。 可 以 进一步 弱化 P 来 解决 这 种 情况 。 再 次 假定 令 牌 
也 具有 颜色 (白色 或 者 黑色 )，P 被 弱化 为 P。 和 人 (PoV PiV PVP), $p 

Pw 令 牌 为 黑色 

如 果 黑 色 进 程 转发 令 牌 ， 令 牌 变 黑 ， 则 令 牌 转发 保持 PP3。 

规则 3 ” 当 黑 色 进 程 转发 令 牌 时 ， 令 有 牌 变 成 黑色 。 

因为 ( 令 牌 为 白色 ) 一 =-P;，po 通 过 它 是 否 接 到 白色 令 牌 ( 且 自 己 也 是 白色 ， 处 于 被 动 状 
态 )， 仍 然 可 检测 出 终止 性 。 . 

现在 可 验证 ， 内 部 行为 、 基 本 通信 以 及 令 牌 转发 保持 已。 如 果 令 牌 返回 po， 且 po 为 黑色 ， 
或 者 mcp。 + q < 0， 那 么 波动 就 不 能 成 功 结束 。 如 果 波 动 不 成 功 的 结束 ， 则 必须 开始 新 的 波 
动 。 

规则 4 ” 当 波 动 不 成 功 结束 时 ，po 开 始 新 一 次 波动 。 
如 果 没 有 一 种 方式 使 得 黑色 进程 再 次 变 成 白色 进程 ， 下 次 波动 还 是 不 会 成 功 。 当 转发 令 
牌 时 ， 黑 色 进 程 将 使 得 令 牌 为 黑色 ， 同 时 引起 下 一 次 波动 失败 。 

观察 可 见 ， 如 果 i > t:， 变 成 白色 的 进程 p; 并 不 使 得 P 为 假 ， 当 po 通过 向 pw_! 发 送 令 牌 开始 波 
动 时 ，P 总 是 变 为 真 。 这 蕴含 着 ,一旦 转发 令 牌 ， 令 牌 可 以 安全 地 变 成 白色 。 

规则 5 在 发 送 令 牌 之 后 ， 每 个 进程 立即 变 成 白色 。 

在 基本 计算 终止 后 ， 变 成 白色 足以 保证 波动 最 终 成 功 。 如 图 8-7 所 示 的 算法 所 示 。 
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var statey : (active, passive) ; 
color, : (white, black) ; 
mep : integer init 0 ; 


S,: { state, = active } 
begin send (mes) ; 
MCp := Mcp +1 (* Rule M *) 


end 


Rp: { A message (mes) has arrived at p } 
begin receive (mes) ; state, := active ; 
MCp := Mcp — 1; (* Rule M *) 
color, := black (* Rule 2 *) 
end 


Ip: { state, = active } 
begin state, := passive end 


Start the detection, executed once by po: 
begin send (tok, white,0) to py_; end 


Tp: (* Process p handles the token (tok, c,q) *) 
{ state, = passive } (* Rule 1 *) 
begin if p = po 
then if (c = white) A (color, = white) A (mcp + q = 0) 
then Announce 
else send (tok, white,0) topn_; (* Rule 4 *) 
else if (color, = white) (* Rules 1 and 3 *) 
then send (tok,c,q + mcp ) to Next, 
else send (tok, black, q + mcp) to Neat, ; 
color, := white (* Rule 5 *) 
end 





图 8-7 Safra 算 法 


定理 8.9 对 于 带 异 步 消 息 传递 的 计算 ，Safra 算 法 (图 8-7 所 示 的 算法 ) 是 正确 的 终止 检测 
算法 。 

证 明 。 谓词 P = P,,A (PoV PiV P2V P3), 设计 算法 满足 ， P 是 算法 的 不 变 式 。 

为 了 证 明 安全 性 ， 观 察 当 f = 0， state, = passive, color, = white, Hmc +q = 0 时 ， 检 
测 终 止 性 。 这 些 条 件 萤 含 着 -aP;、-P 及 -aP!， 因 此 Ps 人 Poe 此 结论 与 state。 = passive 和 mcp + 
q=0, 44term, 

为 了 证 明 活 动 性 ， 基 本 计算 终止 后 。 消 息 计数 器 为 常数 ， 其 和 为 0。 在 这 种 配置 中 开始 的 
波动 以 mcs_+ q = 0 且 所 有 进程 变 成 白色 为 结束 。 这 样 保证 了 下 一次 波动 是 成 功 的 。 口 

不 像 Dijkstra-Feijen-Van Gasteren 算 法 ， Safra 算 法 没有 限定 的 最 坏 情况 复杂 度 。 当 所 有 令 
牌 处 于 被 动 状态 ， 令 牌 可 被 无 限 次 的 传递 ， 但 是 有 些 基 本 消息 仍 在 传输 相当 长 的 时 间 。 至 于 
Dijkstra-Feijen-Van Gasteren 算 法 ， 对 于 时 间 复 杂 度 为 7 的 基本 计算 ， 消息 复杂 度 期 望 值 为 
O(T+N), 

向 量 计 数 算法 

Mattern[Mat87] 提 出 了 可 与 Safra 算 法 相 比 的 算法 ， 该 算法 保存 对 每 个 目的 节点 计数 的 专门 
消息 。 对 于 进程 p»， 用 数组 mcp[P] 存 放 消 息 的 计数 。 当 p 向 g 发 送 消 息 时 ， P 用 mc, [q] = me,[q]+1 
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更 新 计数 ， 当 p 接 收 消息 时 ，p 用 mcp[p] = mcr[p]-1 更 新 计数 。 令 牌 也 携带 计数 数组 ， 当 P 处 理 
令 牌 时 ，mcs 被 加 到 令 牌 中 ， 重 设 为 0 (数组 的 每 个 元 素 为 0)， 令 牌 等 于 0 上 时， 检测 终止 性 。 

向 量 计数 算法 优 于 Safra 算 法 。 但 是 也 有 严重 的 不 足 。 该 算法 的 优点 是 终止 检测 快 ， 即 ， 
在 终止 出 现 后 令 牌 的 一 轮 循环 内 ， 进 行 检测 。 第 二 个 优点 是 只 要 计算 没有 终止 ， 令 牌 时 常 被 
挂 起 。 这 可 能 减少 算法 中 交换 的 控制 消息 数 。 在 Safra 算 法 中 ， 每 个 被 动 进程 转发 令 牌 ,在 向 
量 计数 算法 中 ， 如 果 令 牌 中 的 信息 蕴含 着 消息 仍 在 到 p 的 路 上 ， 则 进程 p 将 不 转发 令 牌 。 

向 量 计数 算法 的 主要 缺点 是 令 牌 包含 大 量 信息 ( 即 ， 每 个 进程 一 个 整数 )， 在 每 条 控制 消 
息 中 都 被 传递 。 如 果 进程 数 较 小 ， 这 种 缺点 可 能 不 是 太 严 重 。 另 一 个 缺点 是 ， 需 要 有 关 其 他 
进程 标识 的 知识 。 如 果 用 数组 表示 向 量 ， 每 个 进程 必须 预先 知道 全 体 标 识 的 集合 。 如 果 用 进 
程 -整数 对 的 集合 表示 向 量 ， 则 可 放宽 这 个 要 求 。 初 始 时 ， 每 个 进程 必须 至 少 知道 它 的 近邻 标 
识 《〈 以 便 正 确 地 增加 计数 )， 其 他 的 标识 在 计算 的 过 程 中 得 知 。 


8.3.3 利用 确认 


Safra 算 法 对 发 送 和 接收 的 基本 消息 进行 计数 ， 以 便 确定 没有 基本 消息 在 传输 中 ， 也 可 能 
使 用 确认 来 确保 这 样 ， 几 位 作者 扩充 了 Dijkstra-Feijen-Van Gasteren 算 法 ， 参见 Naimi[Nai88]。 
这 里 仅 对 改变 的 原理 作 简要 讨论 ， 因 为 所 得 算法 放 没 有 对 Shavit-Francez 算 法 有 所 改进 ， 因 此 
已 经 过 时 。 
首先 ， 没 有 消息 在 传输 中 等 价 于 : 对 于 所 有 P， 不 存在 p 所 发 送 的 消息 在 传输 中 。 每 个 进 
程 对 其 所 发 送 的 消息 负责 ， 即 ， 在 没有 肯定 那个 进程 所 发 送 的 所 有 基本 消息 都 被 接收 之 前 ， 
不 能 调用 Announce。 检 测 方法 按照 以 下 方式 ， 为 每 个 进程 定义 了 一 个 局 部 条 件 quiet(p)。 
quiet(p) => (state, = passive A 传输 中 没有 p 所 发 送 的 基本 消息 ) 
Wi (Wp: quiet(p)) = term, . 
为 了 确定 没有 p 所 发 送 的 消息 在 传输 中 。 每 条 消息 都 要 被 确认 ， 每 个 进程 保存 对 必须 接收 
的 确认 消息 的 计数 。 形 式 地 ， 断 言 P, 定 义 如 下 。 
P,= Yp: (unack,=# (传输 发 送 方 为 p 的 消息 ) 
+# (传输 到 p 的 确认 消息 )) 
在 下 述 规则 下 ， 它 是 不 变 式 。 
规则 A 当 发 送 消息 时 ，p 使 得 unacks 增 加 ; 当 接 收 来 自 q 的 消息 时 ，p 向 g 发 送 确认 消息 ;: 
当 接 到 确认 消息 时 ，p 使 得 wnach, 减 小 。 
上 述 对 于 quiet ( 即 ，gquiet(p) 歼 含 着 p 是 被 动 的 且 没 有 p 所 发 送 的 基本 消息 在 传输 中 ) 所 
做 的 要 求 可 以 得 到 满足 ， 如 果 gquiet 如 下 定义 


quiet(p) = (state, = passive 人 unack, = 0) 


检测 算法 的 推导 与 Dijkstra-Feijen-Van Gasteren 算 法 的 步骤 近似 。 并 通过 考虑 断言 已 来 开 
始 ， Po 定义 为 


Po aWVi(N>i>t): quiet(p) 


3 引入 P 需要 仔细 。 因 为 当 进程 p 发 送 消息 时 ， 进 程 p, (i < 1) 对 进程 p; (j > 1) 的 激活 不 
会 与 由 p; 发 送 消息 发 生 在 同一 事件 中 。 然 而 ， 当 被 激活 时 (因此 使 得 Po 为 假 )， unack, > 0。 
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如 果断 言 P 如 下 定义 
P, = Vp: (unack, >0 = color, = black) 
在 下 述 规则 下 ， 它 是 不 变 式 。 
RUB ” 当 进 程 发 送 时 ， 它 变 成 黑色 ; 仅 当 进程 静止 时 ， 才 变 成 白色 。 
结论 正好 证 明了 Po 为 假 时 ，Pi 成 立 ， 因 此 (PoV Pi) 不 为 假 。 
图 8-8 所 示 的 算法 给 出 了 所 得 算法 。 它 的 不 变 式 为 PA PA (PoV PiV Po), HP 


P, = Wp: (unack,= # (传输 发 送 方 为 p 的 消息 ) 
+# (传输 目的 为 p 的 确认 消息 )) 


P, = Wp: (unack,> 0 = color, = black) 
Po = Wi(N>i>t): quiet (p) 

P, = Ji(t > i > 0): color, = black 
P, = 令 牌 为 黑色 


var state, : (active, passive) ; 
color, : (white, black) ; 
unack, : integer init 0 ; 


Sp: { state, = active } 
begin send (mes) ; unackp := unackp +1; (* Rule A *) 
color, := black (* Rule B *) 


- 


end 


R,: { A message (mes) from q has arrived at p } 
begin receive (mes) ; statep := active ; 
send (ack) tog (* Rule A *) 
end 


I,: { state, = active } 
begin state, := passive end 


Ap: { An acknowledgement (ack) has arrived at p } 
begin receive (ack) ; unackp := unackp—lend (* Rule A *) 


Start the detection, executed once by po: 
begin send (tok, white) to py_, end 


Tp: (* Process p handles the token (tok, c) *) 
{ state, = passive A unacky = 0 } 
begin if p = po 
then if c = white A color, = white 
then Announce 
else send (tok, white) to py—1 
else if (color, = white) 
then send (tok,c) to Nezt, 
else send (tok, black) to Nezt, ; 
color, := white (* Rule B *) 
end 





图 8-8 利用 确认 的 终止 检测 
定理 8.10 对 于 具有 异步 消息 传递 的 计算 ， 图 8-8 所 示 的 算法 是 正确 的 终止 检测 算法 。 
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证 明 。 当 进程 po 静止 且 进 程 为 白色 时 ， 发 布 终止 消息 。 这 些 条 件 细 涵 ~P; 和 -Pl， 因 此 P。 信 
Ps 人 Po 成 立 。 这 蕴含 着 对 于 gquiet(po)， 所 有 进程 静止 ， 因 此 term 成 立 。 

当 基 本 计算 终止 时 ， 经 过 若干 时 间 ， 收 到 所 有 确认 消息 ， 且 所 有 进程 变 成 静止 状态 。 所 
有 进程 为 静止 时 开始 的 第 一 次 波动 ， 在 终止 时 变 成 白色 ， 在 下 一 次 波动 结束 时 发 布 终止 消 
息 。 口 

基于 有 限 消息 延迟 的 方法 ”在 消息 延迟 受 常数 4 限定 (参见 3.2 节 ) 的 假设 下 ， 文 献 
[Tel91b，4.1.3 小 节 ] 描 述 了 一 类 解决 终止 检测 (和 其 他 问题 的 ) 方法 。 在 这 些 方 法 中 ， 在 最 近 
的 消息 发 送 后 ， 进 程 在 4 个 时 间 间 隔 保持 非 静 止 状态 ， 同 时 只 要 进程 处 于 非 静 止 状态 ， 就 保持 
黑色 。 在 解决 方法 中 ， 利 用 上 面 描述 的 确认 方法 。 进 程 p 变 成 静止 ， 如 果 (1) p 最 近 发 送 的 消 
息 至 少 在 4 个 时 间 单 位 前 ，(2) p 是 被 动 的 。 算 法 的 完整 形式 推导 留 给 读者 。 


8.3.4 带 波动 的 终止 检测 


到 目前 为 止 所 讨论 的 终止 检测 算法 ， 利 用 环形 拓扑 结构 进行 控制 通信 。 所 有 算法 基于 环 
上 的 波动 算法 。 类 似 的 方法 也 涉及 其 他 拓扑 结构 上 的 一 些 算法 。 例 如 Francez & Rodeh[FR82] 
和 Topor[Top84] 提 出 了 用 有 根 生 成 树 进行 控制 通信 的 算法 。Tan 和 Van Leeuwen[TL86] 给 出 了 
环 网 、 树 网 和 任意 网 的 分 散 式 解决 方法 。 纵 观 这些 方 法 ， 它 们 大 多 数 算法 几乎 相似 ， 除 了 所 
依赖 的 波动 算法 不 同 。 

本 小 节 基 于 任意 波动 算法 ,概述 了 终止 检测 算法 (和 它 的 不 变 式 ) 的 导出 结果 ， 而 非 某 
种 具体 的 算法 (如 ， 环 网 算法 )。 对 于 每 次 波动 ， 进 程 发 送 消息 ， 或 者 判定 的 第 一 个 事件 ， 称 
为 对 那个 进程 的 访问 。 如 果 需 要 ， 假 设 进程 在 满足 局 部 条 件 之 前 ， 能 够 挂 起 访问 。 那 个 进程 
中 同一 波动 的 后 一 事件 永远 不 会 被 挂 起 。 

本 小 节 所 导出 的 结论 仅 适 合 于 基本 计算 中 同步 消息 传递 的 情况 (就 像 在 8.3.1 小 节 中 的 那 
样 )。 这 个 导出 结果 可 以 推广 到 异步 消息 传递 的 情况 ， 类 似 于 8.3.2 节 和 8.3.3 节 的 情况 。 

当 波 动 进行 判定 时 ， 算 法 的 不 变 式 必 须 允 许 进行 终止 检测 。 因 此 ， 作 为 首次 尝试 ， 设 P = 
Po。， 其 中 


= 所 有 被 访问 过 的 进程 是 被 动 的 


确实 ， 当 判定 发 生 时 ， 所 有 进程 已 被 访问 过 ， 这 个 断言 使 得 当 波动 判定 时 ， 进 行 终止 检 
测 。 此 外 ， 开 始 波动 时 (没有 一 个 进程 被 访问 过 )，Po 被 确定 。 如 果 观 察 以 下 的 规则 1， 可 得 
波动 算法 的 活动 性 保持 Po。 

规则 1 波动 只 能 访问 被 动 进 程 。 

遗憾 的 是 ， 当 未 被 访问 过 的 进程 激活 已 被 访问 过 的 进程 时 ，P 为 假 。 因 此 必须 为 每 个 进 
mee EHE PIN EN P) A 

= 存在 一 个 未 被 访问 过 的 黑色 进程 

大 2 之 下 ， 吉 化 的 不 要 直人 到 保 半 . 

规则 2 ”发送 进程 变 成 黑色 。 

如 果 只 能 对 未 访问 的 黑色 进程 访问 ， 波 动 使 得 弱 断 言 为 假 。 通 过 进一步 弱化 P， 可 以 改进 
这 种 情况 。 每 个 进程 提交 一 种 颜色 ， 或 者 为 白色 或 者 为 黑色 ， 作 为 波动 的 输入 。 修 改 波动 使 


N 
~ 
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其 能 够 计算 所 提交 颜色 中 的 最 黑 的 。 回 忆 一 下 ， 波 动 可 以 计算 最 小 值 ,， “最 黑 的 ”就 是 指 最 小 
值 。 当 波动 进行 判定 时 ， 计 算 所 有 提交 颜色 中 的 最 黑 的 。 如 果 所 有 进程 提交 白色 则 最 小 值 为 
白色 ， 如 果 至 少 有 一 个 进程 提交 黑色 ， 则 为 黑色 。 在 波动 中 ， 如 果 还 没有 进程 提交 黑色 ， 则 
调用 波动 为 白色 。 如 果 至 少 一 个 进程 已 经 提交 黑色， 则 调用 波动 为 黑色 。 因 此 ， 一 个 进程 ， 
当 它 被 访问 时 ， 或 者 提交 和 白色， 保持 波动 的 颜色 不 变 ; 或 者 提交 黑色 ， 对 波动 着 黑色 。 

P 被 弱化 为 (Po V PiV Po), Heh 


P, = 波动 为 黑色 


在 规则 3 之 下 ， 断 言 被 保持 。 

规则 3 ” 当 进 程 被 访问 时 ， 向 波动 提交 当前 的 颜色 。 

所 有 基本 通信 以 及 波动 活动 保持 这 个 断言 ， 因 此 它 是 不 变 式 。 如 果 进 程 判定 结果 为 黑色 ， 
则 波动 不 成 功 结束 。 在 这 种 情况 下 ， 开 始 新 一 轮 的 波动 。 如 果 进 程 变 成 白色 ， 新 的 波动 才能 
成 功 ， 这 种 情况 在 访问 波动 后 立即 发 生 。 

规则 4 黑色 波动 中 的 判定 进程 开始 新 一 轮 波动 。 

， 规则 5 ”进程 每 访问 一 次 波动 后 变 成 白色 。 

这 些 规则 保证 ， 在 基本 计算 终止 后 ， 波 动 最 终 成 功 。 如 果 基 本 计算 已 经 终止 ， 则 终止 后 
开始 的 第 一 次 波动 使 得 所 有 进程 为 白色 ， 下 一 次 波动 成 功 结束 。 

在 算法 中 ， 任 何 时 刻 只 能 运行 一 个 波动 。 如 果 有 两 个 波动 A 和 B 并 发 运行 ,访问 B 后 ， 进 
程 变 白 可 能 侵犯 波动 A 的 不 变 式 。 因 此 ， 如 果 检 测算 法 一 定 是 分 散 式 的 ， 就 必须 用 分 散 式 的 
波动 算法 ， 才 能 做 到 检测 算法 的 所 有 初始 进程 在 同一 个 波动 中 合作 。 也 可 能 利用 另 一 种 检测 
原理 ， 在 这 种 原理 中 ， 不 同 的 波动 可 以 并 发 地 计算 而 不 违反 检测 算法 的 正确 操作 ， 参 见 8.4.2 
小 节 。 l 


8.4 其 他 方法 
本 他 讨论 终止 检测 问题 的 另外 两 种 方法 : 信用 -恢复 算法 和 时 发 算 法 。 
8.4.1 信用 -恢复 算法 


Mattern[Mat89aj 提 出 了 快速 检测 终止 性 的 算法 ， 即 在 发 生 后 的 一 个 单位 时 间 内 进行 检测 
(在 定义 6.31 的 理想 的 定时 假设 下 )。 算 法 检测 集中 式 计算 的 终止 性 ， 并 假设 每 个 进程 可 以 直 
接 向 计算 的 初始 进程 发 送 消息 ( 即 ， 网 络 是 星 型 的 ， 以 初始 进程 为 中 心 )。 

在 算法 中 , 赋 给 每 条 消息 和 每 个 进程 一 个 信用 (credit) (A, 该 值 在 0 和 1 之 间 (包括 0 和 1)， 
算法 用 以 下 断言 作为 不 变 式 。 

Sl 所 有 信用 值 (在 消息 和 进程 中 ) 的 和 为 1。 

S2 基本 消息 的 信用 值 为 正 值 。 

S3 活动 进程 的 信用 值 为 正 值 。 

按照 规则 (例如 ， 被 动 进 程 )， 当 没有 指定 时 ， 持 有 正信 用 值 的 进程 向 初始 进程 发 送 它们 
的 信用 值 。 初 始 进程 的 作用 就 像 一 个 银行 ， 收 集 所 有 发 送 给 它 的 信用 ， 并 存放 在 变量 ref ( 表 
示 returned) 中 。 

当初 始 进程 拥有 所 有 信用 时 ， 对 于 要 求 正信 用 值 的 活动 进程 和 基本 消息 ， 蕴含 着 不 存在 
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这 样 的 进程 和 消息 ， 因 此 term 成 立 。 

规则 1 当 rer =1 时 ， 初 始 进程 调用 Announce。 

为 了 满足 活动 性 要 求 ， 必 须 保 证 ， 如 果 出 现 终止 ， 所 有 信用 值 最 终 被 传输 到 初始 进程 。 
如 果 基 本 计算 已 经 终止 ， 也 没有 任何 基本 消息 ， 我 们 仅 需 关注 进程 持 有 的 信用 值 。 

规则 2 ” 当 进 程 变 成 被 动 时 ， 就 将 信用 值 发 送 给 初始 进程 。 

在 初始 配置 中 ， 只 有 初始 进程 是 活动 的 ， 且 具有 正 的 信用 值 ，1 和 ret = 0, XBR ARE 
S1 到 S3。 在 计算 过 程 中 ， 必 须 保 持 不 变 式 。 可 按 以 下 规则 做 到 这 一 点 。 首 先 ， 当 发 送 每 条 基 
本 消息 时 ， 必 须 给 定 每 条 基本 消息 正信 用 值 ; 幸而 ， 它 的 发 送 进程 是 活动 的 ， 因 此 信用 值 为 
正 。 

规则 3 ” 当 活 动 进 程 p 发 送 一 条 消息 时 ， 它 的 信用 值 被 划分 在 进程 p 和 消息 中 。 

当 进 程 被 激活 时 ， 必 须 给 定 一 个 正信 用 值 。 幸 而 ， 它 所 接收 的 消息 包含 正信 用 值 。 

规则 4 ” 当 进 程 被 激活 时 ， 它 的 信用 值 为 激活 它 的 消息 的 信用 。 

有 一 种 情况 没有 包含 在 这 些 规则 中 ， 就 是 已 经 处 于 活动 状态 的 进程 接收 基本 消息 。 进 程 
已 有 正信 用 值 ， 因 此 并 不 需要 消息 的 信用 值 去 满足 $S3。 然 而 ， 信 用 值 不 能 被 毁灭 ， 否 则 这 将 
导致 对 S1 的 侵犯 。 接 收 进程 可 用 两 种 不 同方 式 处 理 信用 ， 两 种 方法 都 可 得 到 正确 算法 。 

规则 5a ” 当 活 动 进程 接 到 一 条 基本 消息 时 ， 就 将 那 条 消息 的 信用 发 送 给 初始 进程 。 

规则 5b 当 活 动 进程 接 到 一 条 基本 消息 时 ， 就 将 那 条 消息 的 信用 加 到 进程 的 信用 中 。 

如 图 8-9 所 示 的 算法 所 示 。 在 算法 中 ， 假 设 每 个 进程 知道 初始 进程 的 名 字 (至 少 在 它 首次 
变 成 被 动 时 )， 算 法 实现 了 规则 5b。 当 初始 进程 变 成 被 动 时 ， 它 向 自己 发 送 消息 。 


var state, : (active, passive) init if p = po then active else passive ; 
cred, : fraction init if p = po then 1 else 0; 
ret : fraction init 0; for po only 


Sp: { statep = active} (* Rule 3 *) 
begin send (mes, cred,/2) ; credp := credy/2 end 


: { A message (mes, c) has arrived at p } 
begin receive (mes,c) ; state, := active ; 
credp :=credp+c  (* Rules 4 and 5b *) 
end 


{ state, = active } 
begin state, := passive ; 

send (ret, cred, ) to po ; credp :=0 (* Rule 2 *) 
end 


: { A (ret,c) message has arrived at po } 
begin receive (ret,c) ; ret := ret +c; 
if ret = 1 then Announce (* Rule 1 *) 


end 





图 8-9 信用 -恢复 算法 


定理 8.11 信用 -恢复 算法 (图 8-9 所 示 的 算法 ) 是 正确 的 终止 检测 算法 。 
证 明 。 算 法 实现 规则 1 至 5， 这 蕴含 着 98, 人 5, A 5; 是 不 变 式 ， 其 中 
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S =l= D + (Berea) + (2 +ret 
Sı = V<mes, c> 在 传输 中 : c>0 
Sz = Vp EP: (state, = passive > cred, =0) 


A (state, = active => cred, >0) 


Sret= 1 时 ， 检 测 终 止 性 ， 由 此 及 不 变 式 ， 昔 含 着 term 成 立 。 

为 了 证 明 活 动 性 ， 由 于 终止 后 ， 没 有 基本 行为 出 现 ， 因 此 只 会 出 现 接 收 消息 <ret，c>， 
每 次 接收 使 得 传输 中 的 消息 数 减 1。 因 此 算法 达到 终止 配置 。 在 这 个 配置 中 ， 没 有 基本 消息 
(由 term) ， 对 于 所 有 P，cred = 0 (由 term 和 5$;)， 也 没有 <ret，c> 消 息 (配置 是 终止 的 )。 因 
此 ，ret=1 (HS), 终止 性 得 到 检测 。 oO 

如 果实 现 规 则 5a， 控 制 消息 数 比 基本 消息 数 多 1。( 这 里 ， 我 们 也 对 po 一 旦 变 成 被 动 而 发 给 
自己 的 消息 计数 . ) 如 果实 现 规则 5b， 控 制 消息 数 等 于 基本 计算 中 的 内 部 事件 数 加 1 ， 它 玉 多 
比 基 本 消息 数 多 1。 规 则 5b 明 显 更 倾向 于 从 控制 算法 的 消息 复杂 度 方面 考虑 问题 。 当 考虑 位 复 
杂 度 时 ,情形 有 所 不 同 。 在 规则 5a 下 ， 除 ret 之 外 ， 系 统 中 每 个 信用 的 大 小 为 2 的 负 逢 次 方 ( 即 ， 
对 于 某 些 自然 数 ， 为 2…)。 用 它 的 负 对 数 减 去 所 要 传输 的 位 数 表 示 信 用 。 

信用 -恢复 算法 是 本 章 惟一 要 求 在 基本 消息 中 包含 附加 信息 的 算法 ( 即 ， 信 用 )。 al Be AS 
消息 中 增加 信息 称 为 捕 带 (piggybacking )。 如 果 不 想 撒 带 ， 消 息 的 信用 可 在 控制 消息 中 传 
输 ， 并 在 基本 消息 之 后 立即 发 送 。( 下 一 小 节 ， 如 果 利 用 Lamport 逻 辑 时 钟 实 现 算法 ， 也 要 求 
PA.) 

WR (消息 和 进程 的 ) 信用 按照 固定 的 位 数 存储 ， 就 会 引出 问题 。 在 这 种 情形 下 ， 存 在 
最 小 的 正信 用 值 ， 不 可 能 再 对 这 个 值 一 分 为 二 。 当 必须 分 割 具有 最 小 可 能 值 的 信用 时 ， 基本 
计算 就 会 被 挂 起 ， 同 时 进程 获得 来 自 初始 进程 的 附加 信用 。 初 始 进程 从 re 中 减 去 这 个 量 ( 结 
采 rer 可 能 变 成 负数 )， 并 将 这 个 量 传输 到 请 求 的 进程 。 一 旦 接 到 ， 进程 再 恢复 基本 计算 。 信 用 
的 上 升 引 起 基本 计算 的 阻塞 ， 这 与 终止 检测 算法 不 影响 基本 计算 的 要 求 相 矛 盾 。 幸而 ， 这 种 
操作 非常 少见 。 i 


8.4.2 基于 时 和 戳 的 终止 检测 方法 


本 小 节 基 于 时 戳 方 法 ， 讨 论 终止 检测 算法 。 假 设 进程 装 有 时 钟 (2.3.3 小 节 )， 为 此 ， 可 用 
硬件 时 钟 和 Lamport 逻 辑 时 钟 (2.3.3 小 节 )。Rana[Ran83] 提 出 了 检测 原理 。 
就 像 8.3.3 小 节 中 的 解决 方法 ， 对 于 每 个 进程 p， Rana 方 法 基于 局 部 逻辑 谓词 quier(p)， 其 





中 
quiet(p) = state, = passive A 传输 中 没有 进程 p 发 送 的 基本 消息 
RASE, (Wp quiet(p)) => term。 如 前 ，guiet 如 下 定义 
quiet(p) = (state, = passive A unack, = 0) 


算法 的 目标 是 ， 对 于 时 刻 ! 中 的 某 一 点 ， 检 查 是 否 所 有 进程 在 时 刻 ! 处 于 静止 状态 。 由 此 得 
/时刻 的 终止 性 。 这 可 以 通过 一 次 波动 完成 、 要 求 每 个 进程 确认 ， 在 那个 时 刻 或 以 后 ， 进程 是 
静止 的 。 不 静止 的 进程 对 于 波动 中 的 消息 不 做 响应 。 这 就 有 效 地 停止 了 波动 。 
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与 8.3 节 的 方法 不 同 ， 波 动 对 于 进程 p 所 做 的 访问 ， 并 不 影响 进程 p 中 用 于 终止 检测 的 变量 ， 
(波动 的 访问 可 能 影响 波动 算法 中 的 变量 ， 并 且 ， 如 果 使 用 Lamport 逻 辑 时 钟 ， 也 会 影响 进程 
时 钟 .) 因此 ， 算 法 的 正确 操作 不 会 受到 几 个 并 发 执行 波动 的 影响 。 

Rana 算 法 是 集中 式 的 。 每 个 进程 只 执行 同一 个 检测 算法 。 如 果 在 8.3.4 小 节 的 算法 中 利用 
分 散 式 波动 算法 ， 也 可 得 到 分 散 式 算法 。 在 Rana 算 法 中 ， 进 程 可 以 开始 各 自 的 波动 , 这些 波 

当 变 成 静止 时 ， 进 程 p 存 储 静 止 时刻 的 时 间 gi,， 并 开始 一 次 波动 ， 检 查 自 q 时 刻 以 来 ， 所 
有 进程 是 否 已 经 静止 。 如 果 是 ， 则 检测 出 终止 。 否 则 ， 将 会 有 一 个 稍 后 会 变 成 静止 的 进程 ， 
并 开始 新 一 轮 的 波动 。 图 8-10 所 示 的 算法 利用 Lamport 时 钟 ， 并 将 环 算法 作为 波动 ， 实 现 了 这 
个 原理 。 


var statep : (active, passive) ; 
网 : integer init 0; (* Logical clock *} 
unack, : integer init 0; (* Number of unacknowledged messages *) 
qty : integer init 0; (* Time of most recent transition to quiet *) 


Sp: { statep = active } 
begin 6, := 6, + 1 ; send (mes, 0p) ; unackp := unacky + 1 end 


R,: { A message (mes, 0) from q has arrived at p } 
begin receive (mes, 0) ; 0p := max(6,, 0) +1; 
send (ack, ,) to q ; statey := active 
end 


Ip: { state, = active } 
begin 6, := 6, + 1 ; statep := passive ; 
if unackp = 0 then (* p becomes quiet *) 
begin qt, := 4p ; send (tok, 0p, qt,,p) to Next, end 
end 


Ap: { An acknowledgement (ack, 6) has arrived at p } 
begin receive (ack, @) ; 0p := max(6p, 0) +1; 
unack, := unack, — 1 ; 
if unack, = 0 and statep = passive then (* p becomes quiet *) 
begin qt, := bp ; send (tok, ,, qt,,p) to Neztp end 
end 


Tp: { A token (tok, 6, gt,q) has arrived at p } 
begin receive (tok, 6, qt,q) ; gp := max(ðp, 0) +1; 
if quiet(p) then 
if p = q then Announce 
else if qt > qt, then send (tok, 9,, qt,q) to Neztp 
end 





图 8-10 Rana 算 法 


定理 8.12 Rana 算 法 (图 8-10 所 示 的 算法 ) 是 正确 的 终止 检测 算法 。 

证 明 。 为 了 证 明 算 法 的 活动 性 ， 假 设 term 在 配置 y 中 成 立 ， 其 中 a 个 确认 仍 在 传输 中 。 从 
那 时 起 ， 只 有 行为 A, 和 T, 出 现 。 因 为 每 个 行为 A, 使 传输 中 的 <ack, 9> 消息 数 减 1。 这 种 行为 
只 能 出 现 有 限 步 。 每 个 进程 变 成 静止 至 多 一 次 。 因 此 ， 一 个 令 牌 至 多 产生 N 次 ， 每 个 令 牌 至 多 
被 传送 N 次 。 所 以 在 a + 入? 步 内 ,终止 检测 算法 达到 终止 配置 8。 在 配置 中 ， term 仍 然 成 立 。 
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设 po 是 6 中 qt 值 最 大 的 进程 ， 即 ， 在 终止 配置 中 ， 对 于 每 个 进程 p， 有 4rm > gp。 当 po 在 最 
后 gis 时 刻 变 成 静止 时 ， 它 发 出 令 牌 <tok，gi。，gqts。，po>。 这 个 令 牌 沿 着 环 一 路 上 被 传递 ， 最 
后 返回 到 po。。 当 它 接 到 这 个 令 牌 时 ， 每 个 进程 p 一 直 保 持 静 止 ， 且 满足 9t, qt。 如 果 不 是 这 
样 ， 一 旦 接 到 令 牌 并 且 迟 于 Po 变 成 静止 ，p 就 会 将 它 的 时 钟 设置 到 大 于 gr 的 一 个 值 ， 这 与 po 的 
选择 矛盾 。 当 令 牌 回 到 po 时 ，zo 仍 然 静 止 ， 因 此 可 以 调用 Announce。 

为 了 证 明 算 法 的 安全 性 ， 假 设 进 程 po 调用 Announce。 当 po 为 静止 ， 且 收回 它 的 令 牌 <tok， 
8，gt，、po> 时 ， 就 会 出 现 这 种 调用 情况 。 这 个 令 牌 已 被 所 有 进程 转发 。 接 着 用 反 证 法 证 明 。 假 
设 当 po 检测 终止 性 时 ，term 并 不 成 立 ， 这 蕴含 着 ， 存 在 一 个 进程 p 是 不 静止 的 。 在 这 种 情况 下 ， 
在 转发 po 的 令 牌 之 后 ，p 变 成 不 静止 的 。 事 实 上 ， 当 p 转 发 令 牌 时 ， 它 还 是 静止 的 。 设 g 是 转发 
令 牌 <tok，8，gqt，po > 后 ， 第 一 个 变 成 不 静止 的 进程 。 这 蕴含 着 g 一 旦 接 到 某 个 进程 ， 如 ,，r 
的 消息 ， 就 被 激活 ， 而 进程 还 未 转发 po 的 令 牌 。( 否则 7 在 转发 令 牌 后 ， 就 会 变 成 不 静止 的 ， 
但 "的 这 个 状态 在 4 变 成 不 静止 状态 之 前 ， 这 与 假设 矛盾 。) 

转发 令 牌 之 后 ，& > 4tm 依 然 成 立 。 这 殖 含 着 ， 对 4 为 不 静止 的 消息 的 确认 PABA, > 

4tm， 而 此 消息 发 送 给 "。 因 此 ， 当 7 接 到 这 个 确认 消息 ， 变 成 静止 时 ，9, > qs 成立。 于 是 ， 当 
r 接 到 令 牌 时 ，gi, > gi 成立。 按照 算法 ，r 并 不 转发 令 牌 。 与 假设 矛盾 。 

Van Wezel[WT94] 利 用 不 变 式 和 范 函 数 ， 给 出 了 算法 正确 性 证 明 。Huang[Hua88] 给 出 了 

不 依赖 于 环 拓扑 结构 的 算法 。 


习题 
8.1 节 


8.1 MSM RA QAO EGE IRS ARM RS. RERE AM RAL HH HRP 
的 什么 地 方 可 以 找到 ? 


8.2 节 
定义 终止 ~ 检测 算法 的 时 间 复 杂 度 (time complexity) 为 基本 计算 终止 和 调用 Announce 之 
间 的 最 差 情 况 单 位 时 间 数 (定义 6.31 的 理想 假设 之 下 )。 
8.2 试 求 Dijkstra-Scholten 算 法 的 时 间 复 杂 度 。 
8.3 将 Shavit-Francez 算 法 应 用 到 具有 惟一 标识 的 任意 网 上 ， 并 保持 较 低 的 控制 消息 开销 ， 
且 用 Gallager-Humblet-Spira 算 法 作为 波动 算法 。 检测 的 时 间 复 杂 度 为 Q(N log N)。 
你 能 以 交换 OUV) 条 领 外 控制 消息 作为 代价 ， 将 算法 的 时 间 复 杂 度 改进 到 O() 吗 ? 
8.3 节 
8.4 如 果 pj 被 pj 凌 活 ， 且 j<1， 或 者 i > t, 在 Dijkstra-Feijen-Van Gasteren 算 法 的 结果 中 ， 
为 什么 谓词 Po 不 会 为 假 ? 
8.5 证明， 对 于 每 个 m， 存 在 交换 m 条 消息 的 基本 计算 ， 使 得 Dijkstra- Feijen- Van 
Gasteren ik Z dem :(N-1) 条 控制 消息 。 


8.4 节 
8.6 在 图 8-9 所 示 的 算法 中 ， 需 做 那些 修改 ， 实 现 信用 -恢复 算法 中 的 规则 5a， 而 非 规则 
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5b? 

8.7 在 Rana 算 法 中 ,假设 进 程 具 有 标识 。 现 在 假设 进程 匿名 ， 但 是 进程 具有 给 环 中 后 继 
发 送 消 息 的 方法 ， 且 已 知 进 程 个 数 。 修 改 图 8-10 所 示 的 算法 ,使 其 在 新 的 假设 下 有 效 。 

8.8 从 算法 的 一 个 不 变 式 ， 证 明 Rana 算 法 (图 8-10 所 示 的 算法 ) 的 正确 性 。 

8.9 ” 重 写 Rana 算 法 (图 8-10 所 示 的 算法 )， 使 其 适合 用 任意 波动 算法 进行 通信 ， 而 不 用 
环 网 算法 进行 通信 。 


an 





第 9 章 匿名 网 络 


在 前 面 各 章 中 ， 为 了 区 别 分 布 式 系统 中 的 进程 ， 假 设 进 程 具 有 惟一 标识 。 在 大 多 数 现 有 
系统 中 ， 这 种 假设 是 有 效 的 。 进 程 的 标识 常常 作为 地 址 ， 用 于 向 进程 发 送 销 息 。 但 是 为 以 后 
所 用 ， 识 别 进 程 也 可 经 由 间接 定 址 (indirect addressing， 参 见 2.4.4 节 )， 每 个 进程 用 已 知 局 部 
过 道 名 识别 它 的 近邻 。 

第 7 章 中 讨论 了 标识 的 另 一 种 用 途 ， 即 用 进程 标识 打破 进程 之 间 的 对 称 性 。 可 在 简单 算 
法 中 ， 像 Chang 和 Robert 算 法 (图 7-3 所 示 的 算法 )， 当 两 个 进程 p 和 gq 初始 化 算法 时 ， 找 到 这 
种 情形 的 典型 例子 。 在 这 个 计算 中 ，p 接 收 q 的 令 牌 ,gq 接收 p 的 令 牌 ， 如果 对 进程 标识 排序 不 
可 用 ， 这 种 情况 就 是 完全 对 称 的 。 通 过 排序 ， 就 可 以 打破 这 种 对 称 性 ， 如 两 个 进程 中 较 小 进 
程 生存 ， 较 大 者 被 击败 。 在 第 7 章 的 其 他 一 些 算法 中 ， 可 以 找到 更 多 依靠 标识 计算 打破 对 称 
性 的 复杂 例子 。 

全 局 惟一 标识 还 可 用 于 检测 终止 性 ， 例 如 在 Finn 算 法 (图 6-9 所 示 的 算法 ) 中 。 进 程 对 它 
间接 地 收 到 的 所 有 进程 信息 进行 检测 ， 判 断 是 否 两 个 名 字 集 一 致 ， 其 中 的 名 字 集 合 fnc 包 括 
NInc 中 (参见 6.2.6 节 ) 进程 的 所 有 近邻 名 字 。 在 Gallager-Humblet-Spira 算 法 中 ， 以 更 复杂 的 
方式 类 拟 地 利用 了 进程 的 标识 。 

本 章 对 匿名 网 络 的 能 力 与 命名 网 络 的 能 力作 了 比较 。 在 命名 网 络 上 可 解 的 哪 一 类 问题 也 
可 以 在 匿名 网 络 上 求解 ? 因为 即使 大 多 数 分 布 式 系统 的 确 为 进程 提供 惟一 名 字 ， 从 理论 上 来 
看 ， 这 个 问题 仍然 主要 是 一 个 相对 的 问题 。 但 实际 上 ， 当 把 价格 低廉 (例如: BA) 的 设备 
组 合成 网 络 时 ， 就 可 能 遇 到 匿名 网 络 。 这 里 我 们 用 Lego MindStorm 玩 具 的 供应 作为 一 个 例子 : 
多 个 控制 器 可 被 装配 成 Lego 模 型 ， 并 进行 通信 ， 但 是 控制 器 是 系列 生产 的 芯片 ， 都 相同 。 首 
先 ， 本 章 中 的 结果 表明 ， 如 果实 际 中 不 用 进程 名 ,许多 问题 得 不 到 解决 。 也 许 ， 出 乎 意料 的 
例子 是 同步 消息 传递 的 实现 (参见 9.1.4 节 )。 第 二 ， 结 果 昔 含 着 ， 如 果 要 用 相同 的 处 理 器 ， 如 
Transputer 或 者 Lego MindStorm ， 构 造 网 络 ， 就 必须 满足 一 定 的 条 件 。 组 件 必 须 带 有 随机 数 产 
生 器 ， 以 便 执行 概率 算法 ， 并 且 进 程 必须 知道 网 络 规模 ， 或 者 必须 应 用 集中 式 初 始 网 络 的 过 
程 。 确 实 ，MindStorm 控 制 器 提供 随机 数 。 

本 章 表明 ， 可 能 打破 匿名 网 络 的 对 称 性 ， 但 却 不 可 能 检测 出 终止 性 ， 除 非 知 道 网 络 规模 。 
Fil Ft Hi (probabilistic algorithm) 打破 对 称 性 是 可 能 的 。 在 这 种 算法 中 ， 进 程 反复 地 
“ 投 撕 硬 币 ”， 直 到 产生 不 同 结果 。 当 发 生 这 种 情况 时 ， 就 打破 了 对 称 性 。 不 用 说 ， 比 较 和 重 
复 投 扼 硬币 的 分 布 式 算法 证 明 是 比 对 原理 (参见 9.3 节 ) 的 简洁 陈述 更 复杂 。 如 果 网 络 规模 已 
知 ， 且 进程 数 与 计数 结果 相 一致 ， 就 可 能 进行 终止 检测 ， 并 把 结果 与 网 络 规模 进行 比较 ， 如 
果 相 等 ， 就 可 进行 终止 检测 。 通 过 投 撞 硬 币 不 可 能 进行 终止 检测 ， 这 是 因为 当 投 拖 时 ， 进 程 
以 很 小 概率 事件 得 出 相等 结果 ， 其 后 就 会 错误 地 结束 终止 (参见 9.4 节 )。 

如 前 所 述 ， 概 率 算 法 可 以 被 广泛 地 应 用 于 匿名 网 络 以 打破 对 称 性 ，9.1 节 形式 化 地 引入 概 
率 算法 。 由 此 产生 了 几 种 概率 上 的 正确 性 表示 法 ， 该 正确 性 表示 法 也 在 9.1 节 定义 。 RT EE 
名 网 络 中 的 重要 性 ， 概 率 算法 在 分 布 式 计算 的 其 他 领域 也 令 人 感 兴趣 。 它们 在 获取 分 布 式 系 
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统 中 的 故障 弹性 方面 也 起 着 重要 作用 ， 正 如 将 在 第 14 章 看 到 的 。 对 于 某 些 由 确定 算法 解决 的 
问题 ， 概 率 解决 方法 具有 较 低 的 复杂 度 ， 但 在 本 书 中 对 这 个 问题 不 做 进一步 讨论 。 


9.1 预备 知识 


匿名 网 络 是 这 样 一 种 网 络 ， 其 中 进程 的 惟一 标识 不 能 用 于 区 分 进程 。 同 时 假设 领导 人 不 
是 优先 可 用 的 。 因 此 ， 有 具有 相同 度 的 所 有 进程 相同 。Angluin[Ang80] 提 出 了 处 理 器 线 (line 
of processor) 这 一 术语 ， 用 以 表示 进程 P|，P;,… 的 无 限 序列 。 其 中 PP 的 度 为 i ( 即 ， 与 ;个 信 
道 相 连 )。 术 语 对 称 系统 (symmetric system) 也 用 来 表示 所 有 进程 都 相同 ( 即 对 称 性 ) 的 网 
络 。 


9.1.1 定义 


本 小 他， 对 第 2 章 中 提出 的 分 布 式 系统 模型 进行 了 扩充 ， 使 其 包括 随机 算法 。 随 机 化 是 指 
利用 “电子 硬币 投 斤 ”和 随机 数 生成 器 获得 进程 的 随机 行为 ， 其 中 每 种 行为 以 已 知 的 概率 发 
生 。 随 机 化 不 同 于 非 确定 性 ， 非 确定 性 是 由 于 相对 速度 的 不 可 预见 性 ， 以 及 进程 通过 不 同事 
件 继 续 执行 的 可 能 性 所 导致 的 。 它 是 一 种 在 系统 计算 集合 上 引入 了 概率 分 布 的 编程 工具 ， 人 允 
许 我 们 以 一 定 的 概率 来 阐述 算法 的 性 质 。 固 有 的 非 确定 性 是 不 可 控制 的 ， 因 此 ， 算 法 设计 者 
总 是 要 处 理由 于 固有 的 非 确定 性 引起 的 所 有 选择 的 最 坏 情 况 。 

1. 概率 算法 i . 

概率 进程 可 模型 化 为 一 个 进程 ， 该 进程 以 投 振 硬 币 决定 执行 每 一 步 。 可 应 用 步 的 集合 不 
仅 依赖 于 进程 状态 ， 而 且 还 依赖 于 进程 中 前 一 步 的 投掷 硬币 的 结果 。 进 程 的 第 一 步 依赖 于 初 
始 状 态 中 所 作 的 投掷 。 

常常 称 非 概率 进程 (RBA) 为 确定 性 进程 (deterministic process) (或 算法 )。 但 是 这 个 
术语 并 没有 排除 这 种 可 能 性 ， 即 非 概率 进程 网 络 以 非 确定 性 方式 执行 。 按 照 第 2 章 的 模型 ， 这 
样 的 网 络 行为 具有 非 确定 性 ， 但 是 其 中 的 选择 取决 于 计算 中 事件 的 调度 安排 ， 对 于 这 些 选择 ， 
也 不 可 能 进行 概率 分 析 。 通 过 随机 化 引信 的 选择 可 进行 概率 分 析 ， 将 概率 分 布 引信 系统 的 计 
算 中 。 为 使 分 布 显 式 ， 在 形式 模型 中 ， 假设 进程 执行 中 产生 的 整个 投 接 序 列 在 执行 之 前 给 出 。 

为 了 理解 形式 定义 ,我 们 首先 考虑 仅 有 内 部 事件 的 进程 。 用 4- 元 组 p = (Z, L H, H) 
定义 概率 进程 (probabilistic process)， 其 中 Z 和 /的 定义 同 定义 2.4， He 和 上 :表示 Z 上 的 二 元 
关系 ， 如 果 第 i 步 硬币 投 拨 为 0，、 则 进程 第 i 步 必须 按照 | 执行， 否则 按照 |! 执行 。 itp = (po, 
Pir.) EA HOA AD BEAU TT RRRA. pRIp-R4 (p-execution) 是 一 个 状态 co， 
“5… 的 最 大 序列 ， 满 足 co ET, (ci, cia) E 上 pi。 观察 可 见 ， 固 有 的 非 确定 性 依然 存在 ， 因 
为 考虑 到 硬币 投掷 结果 ,可 能 产生 不 同事 件 序列 。 然 而 ， 对 于 以 后 的 选择 不 做 概率 上 的 假设 。 
关于 概率 选择 ， 可 以 做 这 样 的 假设 ， 对 于 每 个 : > 0， 每 个 位 的 序列 以 等 概率 ( 即 ， 2*) 出 
现 作 为 p 的 前 级 。 给 定 序 列 p， 概 率 进程 的 行为 就 像 一 个 确定 进程 ， 可 看 作 概 率 进程 的 一 个 特 
例 。 

为 了 引入 进程 之 间 的 通信 ， 定 义 进程 为 状态 集 、 初始 状态 集 和 六 个 事件 关系 组 成 的 8- 元 
组 ， 其 中 六 个 事件 关系 为 发 送 事 件 、 接 收 事件 和 内 部 事件 ， 每 种 事件 表示 硬币 投掷 为 0， 硬 
币 投亲 1 的 两 个 事件 。 分 布 式 概率 算法 (probabilistic distributed algorithm) 可 表示 为 概率 进 
程 的 集合 P。 这 里 并 没有 给 出 它 的 完整 形式 定义 ， 而 是 指出 它 和 2.1.2 节 中 的 定义 的 区 别 。 如 
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果 算 法 利用 异步 消息 传递 ， 分 布 式 概率 算法 的 配置 每 个 进程 的 状态 和 一 个 整数 以 及 消息 集 组 
成 。 整 数 用 于 对 每 个 进程 执行 的 事件 数 计数 。 系 统 的 转移 如 2.1.2 节 中 所 述 ， 另 外 与 p 有 关 的 
每 次 转移 都 增加 一 个 pz 的 步 数 的 计数 。 

如 果 p 是 对 进程 p 的 由 0 和 1 组 成 的 无 限 序列 p* 的 赋值 。 系 统 的 po- 计算 (p-computation) 是 
一 次 计算 ， 在 这 个 计算 中 ， 涉 及 进程 p 的 第 i 次 转移 就 在 由 ps 中 的 第 i 个 元 素 所 确定 的 事件 关系 
中 。 给 定 序列 的 集合 p， 概 率 算 法 的 行为 就 像 一 个 确定 的 分 布 式 算法 ， 可 看 作 分 布 式 概率 算法 
的 一 个 特例 。 对 于 每 个 FE > 0， 假 设 # 位 的 NV 个 序列 以 等 概率 ( 即 ，2 必 ) 出 现 作为 序列 p 的 前 绥 。 
由 假设 可 得 ， 在 概率 算法 的 一 个 实例 中 ， 每 个 进程 以 概率 1 执行 一 个 不 同 的 局 部 算法 。 

2. 概率 算法 的 正确 性 和 复杂 度 

本 章 我 们 用 后 置 条 件 (postcondition y) 获得 问题 的 正确 性 。 算 法 的 目标 是 达到 终止 配置 ， 
在 这 个 配置 中 ， 后 置 条 件 # 得 到 满足 。 后 置 条 件 与 所 考虑 的 问题 有 关 。 对 于 选举 问题 VRE 
“一 个 进程 处 于 领导 人 状态 ， 其 他 进程 处 于 失败 状态 ”， 而 对 于 计算 网 络 规模 的 算法 ，y 就 是 
“对 于 每 个 p，size, 等 于 N”。 终 止 配置 或 者 是 消息 终止 (进程 都 在 等 待 接收 消息 )， 或 者 是 进程 
终止 (进程 处 于 终止 状态 )。 

对 于 确定 算法 ， 它 的 正确 性 表示 如 同 2.2 节 。 如 果 在 每 次 计算 中 ， 算 法 达到 终止 配置 ， 则 
称 确定 算法 是 终止 的 。 如 果 确 定 算法 的 每 个 终止 配置 满足 水 ， 则 称 确 定 算法 是 部 分 正确 的 〈 对 
于 后 置 条 件 y)。 如 果 一 个 确定 算法 既是 终止 的 又 是 部 分 正确 的 ， 则 称 算法 是 正确 的 。 

对 于 概率 算法 ， 通 过 对 p 赋 值 所 得 实例 的 正确 性 可 以 定义 算法 的 正确 性 。 称 概率 算法 是 p- 
终止 的 《p-terminating)， 如 果 在 每 次 p- 计 算 中 ， 概 率 算法 达到 终止 配置 。 称 概率 算法 是 p- 部 
2 EA (p-partially correct， 对 于 后 置 条 件 风 ) ， 如 果 p- 计 算 的 每 个 终止 配置 满足 水 。 称 概率 
算法 是 p- 正 确 的 (p-correct)， 如 果 一 个 概率 算法 既是 p- 终 止 的 又 是 p- 部 分 正确 的 。 

如 果 对 于 每 个 p， 概 率 算法 是 p- 终 止 的 ， 则 概率 算法 是 终止 的 。 如 果 对 于 每 个 p， 概 率 算 
法 是 p- 部 分 正确 的 ， 则 概率 算法 是 部 分 正确 的 。 如 果 对 于 每 个 p， 概 率 算法 是 p-- 正 确 的 ， 则 
概率 算法 是 正确 的 。 

如 果 算 法 是 p- 终 止 的 概率 至 少 为 P， 概 率 算法 以 概率 P 终 止 (terminating with probability 
P)。 如 果 算 法 是 p- 部 分 正确 的 概率 至 少 为 P， 概 率 算法 以 概率 已 部 分 正确 (partially correct 
with probability P). SUR A 2 p-iE RIBBED AP, MRI PEAR (correct with 
probability P). 

以 概率 1 终止 〈 部 分 正确 ,或 正确 ) 的 算法 并 不 等 价 于 终止 性 (部 分 正确 ， 或 正确 )。 对 
于 非 空 赋值 集 ， 其 中 p 在 那个 集合 中 的 概率 为 0， 概 率 算法 则 不 适用 。 

概率 算法 的 p- 消 息 复杂 度 (p-message complexity) 是 指 任何 一 次 p- 计 算 中 ， 交 换 消息 的 
最 大 数 。 概 率 算法 平均 消息 复杂 度 (average message complexity) 是 指 p- 消 息 复杂 度 的 期 望 
值 。 类 似 地 可 以 定义 概率 算法 的 时 间 复 杂 度 和 位 复杂 度 。 

3. 证 明和 否定 性 结果 

本 章 证 明 一 些 否 定性 结果 ， 即 证 明 不 存在 达到 某 一 后 置 条 件 的 算法 。 对 于 确定 算法 ， 容 
易 证 明 这 样 的 结果 。 我 们 可 以 构造 一 个 计算 ， 它 不 终止 ， 但 配置 满足 罗 。 定 理 9.5 中 可 以 找到 
这 类 证 明 的 典型 例子 。 

、 某 一 个 无 限 计 算 的 构造 并 不 能 证 明 概率 算法 的 不 存在 性 。 这 样 一 个 算法 可 能 有 无 限 次 计 
算 ， 仍 然 以 概率 1 终止 。 为 了 证 明 概 率 解 的 不 可 能 性 ， 假定 有 一 个 从 不 同 初始 配置 开始 的 正 
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确 计算 ， 由 该 计算 可 以 构造 一 个 不 正确 的 计算 。 定 理 9.12 和 定理 9.13 中 可 以 找到 这 种 证 明 的 
例子 。 


9.1.2 概率 算法 的 分 类 


按照 算法 能 够 确保 的 正确 性 程度 ， 概 率 算 法 可 分 为 ( 拉 斯 维 加 斯 ) Las Vegas 算法 、( 蒙特 
RF) Monte Carlo 算 法 和 (会 伍德 ) Sherwood 算 法 。 概 率 算法 可 能 是 正确 的 ( 即 ， 部 分 正确 
和 终止 的 )， 或 者 按 一 定 概 率 是 正确 的 。 如 在 9.1.1 小 节 中 的 解释 。 
1. Sherwood 算 法 
正确 的 概率 算法 称 为 Sherwood 算 法 [BB88]。 因 为 我 们 只 关心 间 题 的 可 计算 性 ( 主要 不 是 
关注 它 的 复杂 度 )，Sherwood 算 法 是 令 人 最 少 感 兴趣 的 算法 ， 可 由 下 面 看 出 。 
定理 9.1 如 果 存 在 达到 后 置 条 件 了 的 正确 概率 算法 ， 那 么 存在 一 个 达到 也 的 正确 确定 
算法 。 
证 明 。 设 PA 是 正确 的 概率 算法 。 对 于 每 个 p，PA 是 p- 正 确 的 。 尤 其 是 对 于 每 个 进程 被 赋值 
为 0 的 情况 ; Ep Rik SUA. 
312 考虑 算法 DA， 当 每 次 硬币 投 斤 产 生 值 0 时 ， 它 的 行为 如 同 PA( 即 在 程序 中 ， 用 0 代 赫 每 次 
对 硬币 投掷 的 调用 )。 算 法 是 确定 性 的 ， 而 且 由 于 太 是 po- 正 确 的 ， 所 以 算法 是 正确 的 。 口 
这 个 结果 并 不 蕴含 着 Sherwood 算 法 是 无 用 的 。 它 们 的 平均 复杂 度 可 与 最 好 的 确定 算法 的 
(最 坏 情 况 ) 复杂 度 相 比 。 作 为 一 个 例子 ， 考 虚 Chang-Roberts 选 举 算法 ( 图 7-3 所 示 的 算法 )， 
它 在 最 坏 情 况 下 的 消息 复杂 度 为 @(N?)， 但 在 平均 情况 消息 复杂 度 为 8(N log N)。 在 随机 版 本 
的 算法 中 ， 每 个 进程 通过 随机 选 出 的 位 串 扩展 它 的 名 字 ， 这 个 随机 选 出 的 部 分 在 比较 中 是 最 
重要 的 。 不 管 初始 标识 的 分 布 是 什么 ， 改 进 算 法 的 期 望 复杂 度 为 原始 算法 平均 情况 复杂 讼 ， 
BHO (N log N) 条 消息 。 
本 书 将 不 讨论 Sherwood 算 法 。 
2. Las Vegas 算法 和 Monte Carlo 算 法 
作为 定理 9.1 的 结论 ， 对 于 不 能 用 确定 算法 解决 的 问题 , 最 好 的 算法 是 按 概率 P(0<P < 1) 
是 正确 的 概率 算法 。 通常， 每 次 执行 中 ， 或 者 满足 终止 性 ， 或 者 满足 部 分 正确 性 。 
定义 9.2 Las Vegas 算 法 是 概率 算法 
(1) 该 算法 以 正 概率 终止 ， 且 
(2) 是 部 分 正确 的 。 
Monte Carlo 算 法 是 概率 算法 
(1) 该 算法 是 终止 的 ， 且 
(2) 以 正 概率 部 分 正确 。 
Las Vegas 算法 的 终止 概率 常常 为 1。 只 有 当 无 限 次 选择 随机 位 的 不 利 模式 时 ， 才 存 在 无 限 
次 执行 的 情况 。 实 际 上 ， 这 意味 着 ，Las Vegas 算法 总 是 终止 的 ， 尽管 只 能 给 出 期 望 的 算法 执 
行 步 数 。 却 不 能 给 出 算法 执行 步 数 的 上 界 。 一 个 Las Vegas 算法 的 例子 是 由 Itai 和 Rodeh ( 图 9-4 
所 示 的 算法 ) 提出 的 选举 算法 。 
Monte Carlo 算 法 (如果 它 不 是 Sherwood 算 法 ) 的 失败 概率 总 是 小 于 1。 在 一 个 错误 的 有 
限 次 的 执行 中 ， 只 能 选举 有 限 多 个 随机 位 ， 因 此 执行 的 概率 是 正 的 。 通常 可 以 给 出 Monte 
Carlo 算 法 执行 步 数 的 上 界 。 一 个 Monte Carlo 算 法 的 例子 是 由 Ttai 和 Rodeh 提 出 的 计算 环 规模 的 





FIÈ EZAB 195 


算法 (图 9-5 所 示 的 算法 ) 。 
在 某 些 附加 约束 条 件 下 ， 可 能 从 Monte Carlo 算 法 得 到 Las Vegas 算法 ， 反 之 亦 然 。 参 见习 
题 9.1 和 9.2。 
3. 相关 方面 的 概述 
本 章 的 算法 按照 以 下 4 个 准则 分 类 ; 并 简要 说 明 ， 哪 一 类 算法 被 认为 更 具 吸 引力 。 
(1) 网 络 规模 已 知 或 未 知 。 不 依赖 于 知识 N 的 算法 更 具 吸 引力 ， 因 为 它们 更 具 一 般 
性 。 
(2) 进程 -终止 或 消息 -终止 。 进 程 终止 算法 更 具 吸 引力 ， 因 为 进程 显 式 终止 ， 因 此 
进程 可 以 利用 计算 所 得 的 结果 。 
(3) 确定 性 的 或 概率 的 。 确 定性 算法 更 具 吸 引力 ， 因 为 ， 不 需要 随机 数 生 成 器 ， 其 
正确 性 性 质 比 Las Vegas 算法 和 Monte Carlo 算 法 所 满足 的 正确 性 性 质 更 强 。 
(4) Las Vegas 算法 或 Monte Carlo 算 法 。 通 常 认 为 Las Vegas 算法 更 具 吸 引力 ， 因 为 在 
实际 中 ， 它 们 的 概率 终止 性 与 终止 性 几乎 难以 区 分 。 


9.1.3 本 童 考虑 的 问题 


提出 匿名 网 络 上 计算 的 完整 理论 ， 包括 从 匿名 网 络 中 得 出 的 大 量 结果 ， 不 是 我 们 的 目的 ， 
当 考 虑 与 选举 、 函 数 计算 有 关 的 问题 ， 包 括 计算 网 络 规模 时 ， 我 们 的 意图 是 研究 这 些 网 络 的 
计算 能 力 。 

这 些 问题 是 最 基本 的 。 如 果 能 选 出 领导 人 ， 匿 名 网 络 就 和 命名 网 络 具 有 相同 能 力 。 因 为 
用 集中 式 算法 对 名 字 进 行 赋值 ， 可 如 下 进行 。 在 9.3 节 中 ， 如 果 网 络 规模 已 知 ， 可 以 通过 概率 
算法 选 出 领导 人 ， 这 表明 计算 网 络 规模 的 重要 性 。 因 为 用 集中 式 算法 很 容易 计算 出 网 络 规模 
(正如 以 下 所 示 )， 选 举 和 计算 网 络 规模 就 成 了 等 价 的 问题 。 我 们 将 要 看 到 ， 网 络 规模 不 能 按 
概率 计算 出 来 ， 并 且 ， 如 果 网 络 规模 未 知 ， 选 举 问 题 也 是 不 可 解 的 。 

集中 式 计 算 如 果 惟 一 初始 进程 RFA) 可 用 ， 通 过 回 波 算法 的 一 次 计算 ， 即 可 容易 地 
计算 出 网 络 规模 。 通 过 计算 中 导出 的 生成 树 ， 每 条 向 上 发 送 的 消息 报告 发 送 进程 子 树 中 的 进 
程 数 。 参 见 图 9-1 所 示 的 算法 。 

为 了 赋 惟 一 名 字 ， 首 先 用 图 9-1 所 示 的 算法 计算 网 络 规模 ， 然 后 在 进程 之 间 划 分 区 间 
{0，…，N-1}。 每 棵 子 树 接收 一 个 区 间 ， 区 间 长 度 对 应 于 子 树 规模 。 

定理 9.3 存在 计算 网 络 规模 的 确定 性 集中 式 算法 ， 交 换 21E| 条 消息 ， 时 间 复 杂 度 为 O(N)。 
存在 赋值 惟一 名 字 的 确定 性 集中 式 算 法 ， 交 换 2IEI+ (N-1) 条 消息 ， 时 间 复 杂 度 为 O(N)。 

存在 更 有 效 的 命名 赋值 算法 。 参 见习 题 9.3。 定 理 9.3 的 结果 表明 ， 只 用 很 少 的 开销 ， 领 导 
人 的 可 用 性 就 能 补偿 缺少 惟一 命名 的 问题 。 因 此 ， 在 匿名 网 络 的 研究 中 ， 假 设 除了 没有 名 字 
以 外 ， 领 导 人 也 不 可 用 。 


9.1.4 同步 消息 传递 与 异步 消息 传递 


匿名 团 上 与 选举 相关 的 结果 对 于 通信 方式 是 同步 还 是 异步 消息 传递 很 敏感 。 在 同步 消息 
传递 下 ， 系 统 的 一 次 转移 中 的 两 个 进程 合作 ， 其 中 两 个 进程 间 的 对 称 性 被 打破 。 
定理 9.4 对 于 通过 同步 消息 传递 进行 通信 的 两 个 进程 组 成 的 网 络 ， 存 在 确定 性 的 、 进 程 
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终止 的 选举 算法 。 
证 明 。 每 个 进程 有 三 种 状态 ， 妈 sleep 状态 、leader 状 态 和 losit 状 态 。 初 始 状态 是 sleep 状 态 。 
每 个 进程 或 者 发 送 并 进入 终止 状态 leader， 或 者 接收 并 进入 终止 状态 iost。 


Var recp : integer init 0 ; (* Counts number of received messages *) 
father, : P init udef ; 
Sizep : integer init 1 ; (* Size of subtree of p *) 


For the initiator: 
begin forall q € Neigh, do send (tok,0) to q ; 
while rec, < #Neigh, do 
begin receive (tok, s) ; recp := recp + 1; 
SiZep :一 31zep +S 
end (* The network size is sizep *) 
end 


For non-initiators: 
begin receive (tok, s) from neighbor q ; father, := q ; recp := recp +1; 
forall r € Neigh,, r # father, do send (tok,0) tor; 
while rec, < #Neigh, do 
begin receive (tok, s) ; recp := recp +1; 
Sizep := S1Zep + $ 
end ; 
send (tok, sizep ) to father, 
end 





图 9-1 网 络 规模 的 集中 式 计算 


因此 ， 系 统 有 九 种 配置 ， 但 只 有 三 种 是 可 达 的 。 从 初始 配置 (sleep, sleep) 开始 ， 系 统 
可 转移 到 配置 (leader，lost) 和 配置 (lost，leader)。 这 两 个 配置 都 是 进程 终止 的 ， 在 状态 
leader 和 状态 lost， 都 只 包含 一 个 进程 。 口 

算法 来 自 Angluin[Ang80]， 概 述 了 任意 规模 田 上 的 算法 。 如 果 通 信和 是 异步 消息 传递 ， 则 
该 问题 不 存在 确定 性 算法 。 可 用 与 定理 9.5 中 将 使 用 的 类 似 方法 证 明 。 我 们 不 考虑 对 称 性 被 通 
信 机 制 打破 的 情况 ， 只 考虑 通信 是 同步 消息 传递 的 系统 。 

Angluin 提 供 的 方法 ， 是 特定 用 于 拓扑 结构 的 ， 例 如 ， 不 适合 于 环 。 本 章 不 可 能 性 的 结果 
将 推广 到 具有 任意 或 环 的 拓扑 结构 的 同步 消息 传递 的 系统 上 。 

如 果 消 息 传递 是 同步 的 ， 就 一 定 能 打破 两 个 进程 之 间 的 对 称 性 。 但 是 如 果 消 息 传递 是 异 
步 的 ， 就 不 能 打破 两 个 进程 之 间 的 对 称 性 。 结 果 是 不 存在 确定 算法 ， 在 异步 消息 传递 的 匿名 
网 络 中 实现 同步 消息 传递 。 


9.2 确定 算法 


本 节 介 绍 一 些 与 确定 算法 相关 的 结果 。 最 重要 的 结果 是 否定 性 的 ， 不 可 能 确定 性 地 选 出 
领导 人 。 甚 至 在 环 规模 已 知 时 也 不 能 选 出 。 同 时 证 明 ， 如 果 已 知 环 规模 ， 就 可 进行 函数 计 
算 ; 如 果 环 规模 未 知 ， 就 不 能 计算 函数 。 


9.2.1 确定 性 的 选举 : 否定 性 的 结果 
本 小 节 将 要 证 明 ， 在 匿名 网 上 ， 不 存在 确定 性 选举 算法 。 证 明 利用 了 对 称 配 置 (symme- 
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tric configuration) 的 概念 。 可 以 证 明 ， 存 在 一 次 计算 ， 它 在 对 称 配置 中 开始 ， 每 N 步 之 后 ， 
达到 一 次 对 称 配置 。 确 定性 算法 的 不 可 能 性 ， 可 由 以 下 观 赛 导 出 : 正确 算法 不 能 终止 于 对 称 
配置 。 

定理 9.5 在 已 知 规模 的 匿名 环 上 ， 不 存在 确定 性 选举 算法 。 

证 明 。 用 单 向 环 证明 这 个 结果 。 当 理解 了 这 个 证 明 过 程 时 ， 很 容易 证 明 双 向 环 上 的 情况 。 
设 进程 po 至 pw-1 按 照 如 下 方式 在 环 上 排列 ， 对 于 i < N-1，pi 只 能 向 pi 发 送 消 息 ，pw-1 向 po 发 送 
消息 。 对 于 环 上 的 一 个 配置 ， 设 c 表 示 P 的 状态 ，M 表 示 目 的 节点 为 pi 的 消息 集 。 

称 配置 是 对 称 的 ， 如 果 所 有 状态 相同 ， 且 传输 到 每 个 进程 的 消息 集 相 同 。 即 ， 

Vi, jı (ci=¢e A M;=M,;) 


对 于 环 上 的 任何 算法 ， 构 造 计 算 C = (yo, Yo …), 满足 在 C 中 的 每 个 配置 yw 是 对 称 的 。 
设 m 是 对 称 初 始 配置 。 存 在 这 样 的 配置 ， 因 为 每 个 进程 具有 相同 的 初始 状态 集 ， 初 始 时 ， 所 有 
MBAS. 

如 果 配 置 yw 是 终止 的 ， 则 构造 完成 。 计 算 C 终 止 于 对 称 配置 。 否 则 ，ywx 是 对 称 配 置 ， 其 
中 至 少 有 一 个 事件 是 可 应 用 的 ， 称 这 个 事件 为 户 中 的 事件 e。 配 置 的 对 称 性 现在 蕴含 着 、 同 一 
个 事件 在 每 个 进程 中 是 可 应 用 的 。 定 理 2.19 蕴 含 着 ， 它 可 以 被 所 有 进程 并 发 地 执行 ， 执 行 N 次 
转移 之 后 ,产生 对 称 配置 。 所 有 进程 从 相同 状态 转移 到 相同 状态 。 如 果 在 事件 中 接收 到 一 条 
消息 ， 就 从 每 个 相同 消息 集 M.; 中 删除 该 消息 ; 如 果 发 送 一 条 消息 ， 就 将 它 加 到 每 个 相同 消息 
集 M: 中 。 因 此 计算 被 扩展 了 N 步 。 此 后 ， 导 致 对 称 配 置 y ono 

由 此 可 得 ， 匿 名 环 的 每 个 算法 的 计算 ， 或 者 无 限 ， 或 者 结束 于 对 称 终止 配置 。 在 对 称 配 
置 中 ， 或 者 所 有 进程 处 于 状态 Leader， 或 者 一 个 也 没有 。 因 此 在 对 称 配置 中 ,不 存在 只 有 一 个 
进程 处 于 leader 状 态 。 对 于 确定 性 选举 算法 ， 所 有 计算 结束 于 终止 配置 ， 但 只 有 一 个 进程 处 于 
leader 状 态 ， 因 此 这 样 的 算法 不 存在 。 口 

定理 9.5 蕴 含 对 于 规模 末 知 的 任意 网 络 或 者 环 中 的 更 一 般 的 选举 问题 ， 不 存在 确定 算法 解 。 


9.2.2 环 上 函数 计算 


选举 的 不 可 能 性 提出 了 这 样 一 个 问题 ， 当 选举 不 可 能 时 ， 是 否 存在 更 “容易 的 ”可 解 问 
题 。 在 本 小 节 中 ， 考 虑 有 向 匿名 环 上 的 函数 计算 问题 。 假 设 进程 p 输 入 为 x; E X， 设 SX 表 示 X 
中 所 有 元 素 序 列 集 。5X 上 的 函数 /是 周期 的 (cyclic )， 如 果 在 输入 的 周期 移动 中 它 是 不 变 的 。 
即 ， 对 于 所 有 x 的 周期 移动 ”f(y) = f(x)。 周 期 函数 的 例子 有 : 求 和 、 求 整数 的 最 小 值 或 最 
大 值 、 布 尔 函 数 的 合 取 、 析 取 和 不 可 兼 或 、 输 入 的 长 度 等 等 。 假 设 进程 7 有 变量 result,， 计 算 f 
RRE RREA “result, =f (xo，...，xw-1)”。 

本 小 节 的 结果 表明 了 环 规 模 知识 以 及 区 别 消 息 终止 和 进程 终止 的 重要 性 。 

1. 已 知 环 规模 

如 果 已 知 环 规模 ， 可 以 收集 每 个 进程 中 的 所 有 输入 ， 用 确定 算法 就 可 以 计算 出 每 个 周期 
PAR. “ERIM ERAS AK (input collection)。 输 入 集 的 代价 为 N(N-1) 条 消息 ， 这 也 是 用 确 
定 算法 计算 某 些 函 数 的 下 界 。 

定理 9.6 ”如 果 已 知 环 规模 ， 用 进程 -终止 的 确定 算法 计算 周期 函数 的 消息 复杂 度 为 
MN -1), 

证 明 。 为 使 叙述 简明 ， 假 设 信 道 是 fifo 的 。 算 法 按 N-1 步 发 送 消息 。 在 第 一 步 中 ， 每 个 进 
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程 向 其 顺 时 针 方向 的 近邻 发 送 自 己 的 输入 ， 并 从 其 逆 时 针 方 向 的 近邻 接收 输入 。 在 下 一 步 中 ， 
每 个 进程 将 它 在 前 一 轮 中 所 接收 的 值 发 送 给 其 顺 时 针 方 向 的 近邻 ， 并 从 其 逆 时 针 方 向 的 近邻 
处 接收 新 值 。 由 于 在 每 一 轮 中 ， 每 个 输入 被 进一步 传递 一 个 进程 ， 在 第 ; 步 中 ， 进 程 接收 来 自 
它 的 第 ;个 逆 时 针 方向 近邻 的 输入 ，N-1I 步 后 , 收集 完 所 有 输入 (按照 它们 在 环 上 出 现 的 次 序 )。 
通信 轮 完成 之 后 ， 每 个 进程 局 部 计算 /的 值 ， 并 终止 。 口 

定理 9.7 ”任何 计算 AND、OR 和 SUM 的 确定 进程 -终止 算法 ， 在 最 坏 情况 下 至 少 交 摘 
N(N-1) 条 消息 。 

证 明 。 设 给 定 解决 这 些 问 题 之 一 的 确定 的 进程 -终止 算法 A。 类 似 于 7.2.3 小 节 中 的 定义 ， 
消息 的 轨迹 (trace) 定义 如 下 。 如 果 p 在 接收 消息 之 前 发 送 消 息 ， 则 这 条 消息 的 轨迹 为 (p)。 
如 果 到 目前 为 止 p 已 经 接收 的 消息 的 最 长 轨迹 为 (pi ，…，pi)， 则 发 送 消 息 m，m 的 轨迹 为 
(Piss Pes P)o 

定理 中 提 到 的 三 个 问题 具有 共性 。 至 少 对 于 一 个 对 称 初始 配置 ， 在 终止 之 前 ， 进 程 必须 
接收 长 度 为 N-1 的 轨迹 。 对 于 SUM 问 题 ， 每 一 种 初始 配置 ， 就 是 这 种 情况 。 对 于 AND 问 题 ， 
存在 这 样 一 种 情况 ， 即 每 个 进程 输入 为 frue。 而 对 于 OR 问题 ， 存 在 每 个 进程 输入 为 false 的 情 
况 。 为 证 明 必 须 接 收 长 度 为 N-1 的 轨迹 ， 考 虚 AND 的 计算 ， 其 中 每 个 进程 输入 为 true， 在 这 种 
情况 下 ， 解 为 rue。 假 设 当 进程 所 接 到 的 最 长 消息 轨迹 为 < N-1 时 ， 进 程 以 输出 rrue 终 止 。 其 
中 的 进程 因 某 种 原因 而 终止 的 事件 只 取决 于 k+1 个 进程 中 的 事件 ， 因 此 它 也 可 以 出 现在 从 初始 
配置 开始 的 计算 中 ， 在 初始 配置 中 ， 这 个 进程 输入 为 1rue， 其 他 输入 为 false。 

如 果 每 个 进程 处 于 同一 状态 且 每 个 信道 包含 同样 的 消息 集 ， 则 称 配置 是 对 称 的 。 正 如 在 
定理 9.5 中 证 明 的 那样 ， 构 造 一 个 计算 ,使 其 每 N 步 后 ， 达 到 对 称 配 置 状 态 ， 且 在 计算 中 ， 每 
个 进程 执行 相同 的 事件 集 。 选 举 初始 配置 ， 使 得 算法 至 少 发 送 一 条 轨迹 长 为 N-1 的 消息 。 在 
计算 中 ， 对 于 每 个 i < N-1， 算 法 至 少 发 送 一 条 轨迹 长 为 的 消息 。 但 是 ， 因 为 每 个 进程 执行 相 
同 的 事件 集 ， 所 发 送 的 轨迹 长 为 的 消息 数 是 N 的 倍数 。 因 此 至 少 为 N。 于 是 消息 数 至 少 为 N - 
(N-i). g 

2. 环 规 模 未 知 

如 果 环 规模 未 知 ， 利 用 进程 -终止 的 确定 算法 就 不 能 计算 出 非 - 常 国 数 。 结 果 的 证 明 利用 
了 重 现 算 法 在 环 上 各 个 部 分 进行 (正确 ) 计算 的 技术 。 如 果 f 是 常 函数 ( 即 对 于 每 个 x,， f(x) 
= Cc)， 它 的 计算 可 以 利用 一 种 算法 简单 地 进行 ， 该 算法 可 以 立即 地 终止 于 每 个 进程 P， 且 
result, = c、 否 定性 的 结果 只 关心 非 ~ 常 函数 。 

定理 9.8 如 果 环 规模 玉 知 ， 不 存在 计算 非 ~ 常 澡 数 的 确定 进程 -终止 算法 。 

证 明 。 因 为 是 非 - 常 函数 ， 存 在 输入 x = (xo，...，xi-1) Aly = (yo，...，yi.1)， 满 足 
f(x) #fly), BRAS (x) =a, fly) = 5。 设 4 是 一 个 确定 的 、 进 程 -终止 的 算法 ， 满 足 在 
输入 为 的 环 上 ， 存 在 计算 C.， 在 计算 中 存在 进程 p 以 resuli, = a 终止 ， 且 在 输入 为 y 的 环 上 ， 存 
在 计算 C,， 在 计算 中 存在 进程 q 以 result, = b 终 止 。 

设 在 Cr 中 ，P 所 接收 的 消息 的 最 长 轨迹 为 KK， 可 能 K > kx， 因 为 在 p 终 止 之 前 ，A 可 能 沿 着 环 
循环 几 次 消息 。 考 虑 更 大 的 环 ， 该 环 包括 一 个 有 K+1 个 进程 的 段 ?， 具 有 以 下 性 质 。 已 知 5 的 
最 后 一 个 进程 ( 即 在 段 的 硕 时 针 方向 的 最 后 进程 ) 与 计算 Cc, 中 进程 p 的 输入 相同 ， 称 此 进程 为 
p's Chap 的 第 i 个 逆 时 针 近 邻 的 输入 与 计算 C. 中 进程 p 的 第 i 个 逆 时 针 近 邻 的 输入 相同 。5 中 的 
进程 与 环 中 输入 为 x 的 进程 的 对 应 ， 如 图 9-2 所 示 。 
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当 在 包含 段 5 的 环 上 执行 时 ， 算 法 A 的 计算 具有 以 下 性 质 。 对 于 每 个 :< KK， 进 程 p' 的 第 i 个 
逆 时 针 近 邻 发 送 所 有 轨迹 长 <K +1-i 的 消息 ， 这 些 消息 也 是 由 计算 C: 中 进程 p 的 第 i 个 逆 时 针 近 
邻 发 送 的 。 这 可 以 对 kK 用 向 下 归纳 法 证 明 。 

情形 i =K: 进程 p' 的 第 K 个 逆 时 针 近 邻 与 C. 中 进程 p 的 第 K 个 逆 时 针 近 邻 具 有 相间 初始 状态 ， 
因此 存在 计算 ， 在 该 计算 中 ， 发 送 相同 的 消息 集 ， 消 息 轨迹 长 度 为 1。 | 

妇 纳 步 : 假设 在 某 些 计 算 中 ， 进 程 p' 的 第 (i+1) 个 逆 时 针 近 邻 发 送 轨迹 长 < K-i 的 所 有 消 
息 ， 这 些 消息 是 由 计算 C, 中 进程 p 的 第 i 个 逆 时 针 近 邻 发 送 的 。 在 这 个 计算 中 ， 进 程 p' 的 第 i 个 
逆 时 针 近 邻 与 C: 中 进程 p 的 第 ;个 逆 时 针 近 邻 具 有 相同 初始 状态 ， 并 且 接 收 由 轨迹 长 < K-i 的 消 
息 组 成 的 相同 消息 集 。 因 此 存在 计算 ， 其 中 所 发 送 的 由 轨迹 长 度 <K + 1-i 的 消息 组 成 的 消息 
集 与 C. 中 进程 p 的 第 i 个 逆 时 针 近 邻 发 送 的 消息 集 相同 。 

任 所 构造 的 计算 中 ，p' 接 收 的 消息 集 与 C. 中 进程 p 接 收 的 消息 集 相同 ， 且 p' 与 ?有 相同 初始 
状态 。 因 此 存在 计算 ， 在 这 个 计算 中 ，p' 以 result。 = a 终止 。 

所 构造 的 计算 “欺骗 ”进程 p' 以 结果 results, = f(x) 进入 终止 状态 ， 而 实际 上 ， 输 入 是 一 
个 不 同 于 x 的 更 长 序列 x'。 如 果 是 f(x') = f (x) 的 情况 ， 计 算 仍 会 给 出 正确 结果 。 为 了 产生 了 矛 

盾 结 果 ， 考 虑 包含 该 段 的 环 ， 在 该 段 上 ， 进 程 模拟 计算 C,， 进 程 q9' 以 results. = 5b 终止。 对 于 这 

个 环 ， 存 在 计算 ， 共 中 的 两 个 进程 终止 时 ， 具 有 不 同 result 值 ， 因 为 至 多 一 个 结果 是 正确 的 ， 
因此 了 矛盾 。 口 





图 9-2 不 正确 计算 的 构造 


定理 9.9 ”在 规模 未 知 的 环 上 ， 存 在 计算 OR 和 AND 的 确定 消息 -终止 算法 ， 至 多 利用 N 条 
消息 。 

证 明 。 如 果 至 少 一 个 进程 的 输入 为 true， 则 OR 的 值 为 rxe。 如 果 所 有 进程 的 输入 都 为 false， 
则 它 的 值 为 false。 一 旦 初始 化 ， 进 程 p 进 行 赋值 resuli, := x,， 且 如 果 %s 为 1rxe， 则 向 其 顺 时 针 近 
邻 发 送 <yes> 消 息 。 当 进程 p 接 到 这 个 消息 时 ， 如 果 resuiz 的 值 为 tue， 则 忽略 这 条 消息 ; 否则 ， 
将 resuli, 的 值 设 为 true， 并 转发 这 条 消息 ， 参 见 图 9-3 所 示 的 算法 。 

首先 考虑 每 个 进程 输入 为 false 的 情况 。 每 个 进程 对 result, 赋 值 为 false ， 并 开始 等 待 一 条 消 
息 。 由 于 没有 进程 发 送 消息 ， 其 中 的 每 个 进程 等 待 的 配置 是 终止 的 ， 在 这 种 情况 下 ， resulio 包 
含 正 确 解 (false). 

其 次 考虑 有 一 些 进程 其 输入 为 rue 的 情形 ， 输 入 为 frue 的 进程 p 为 resuit, 赋 值 irne ， 并 把 
<yes> 消 息 发 送 到 下 一 进程 。 由 于 每 个 进程 至 多 发 送 一 条 消息 (参见 图 9-3 所 示 的 算法 )， 在 这 
种 情况 下 ， 也 达到 终止 配置 。 如 果 在 终止 配置 中 ， result, = true, AbAresultye,, = ture， 因 为 p 
所 发 送 的 消息 被 Nexis 接 收 。 由 于 至 少 存在 一 个 进程 p»， 使 得 result, = true， 因 此 ， 对 于 每 个 进程 
p, result,= true ， 在 这 种 情况 下 ， 算 法 在 每 个 进程 中 终止 ， 且 有 正确 解 。 


uo 
— 
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AND 的 计算 类 似 , 但 当 所 有 进程 为 true 时 ， 才 为 真 ， 否 则 为 false。 口 


var result, : boolean ; (* Result of the computation *) 
Tp : boolean ; (* Input of p *) 


begin result, := £p ; 
if zp is true then send (yes) to Neztp ; 
receive (yes) ; 
if result, is false then 
begin result, := true ; send (yes) to Nezt, end 
end 





图 9-3 确定 性 的 OR 计 算 


3. 已 知 环 规模 的 部 分 知识 

作为 在 已 知 环 规模 和 未 知 环 规模 之 间 的 折 圳 ， 我 们 考虑 环 规模 N 未 知 ， 但 是 已 知 它 在 一 定 
稚 限 之 间 的 情况 。 通 过 修改 本 节 所 做 证 明 ， 可 以 很 容易 地 证 明 以 下 结果 。 

(1) 不 存在 计算 SUM 的 确定 算法 ， 对 于 两 个 不 同 规模 的 环 都 是 正确 的 。 

(2) 不 存在 计算 XOR 的 确定 算法 ， 对 于 偶数 环 和 基数 环 都 是 正确 的 。 

(3) 如 果 已 知 环 规模 的 上 界 3， 利 用 N (S-1) 条 消息 ， 就 可 确定 地 计算 出 AND 和 OR。 

4. 其 他 拓扑 结构 

对 于 共 他 类 型 的 网 络 拓扑 结构 ， 也 可 给 出 重 现 证 明 技术 。 但 要 求 能 在 较 大 的 图 上 几 次 
“IRA” (unrolled) 较 小 的 图 。 从 一 个 图 到 吃 一 个 图 所 要 求 的 映射 类 型 称 为 一 个 着 盖 
(cover). 

我 们 也 可 给 出 其 他 拓扑 结构 的 匿名 网 络 上 函数 计算 的 算法 。Beame 和 Bodlaender[BB89] 已 
经 证 明 ， 在 n x an 的 圆 环 上 进行 确定 输入 收集 的 消息 复杂 度 为 O(n3)。 对 于 某 些 函 数 计算 ， 包 括 
AND 和 OR， 计 算 的 下 界 是 Q(N’)。Kranakis 和 Krizanc 证 明 ， 在 n- 维 超 立 方 体 上 进行 输入 收集 
的 位 复杂 度 为 0(2” - nt) [KK90]。 


9.3 概率 选举 算法 


如 果 已 知 网 络 规模 ， 可 以 给 出 以 概率 1 终止 的 部 分 正确 的 选举 算法 。 即 算法 属于 Las Vegas 
类 型 。 由 于 不 存在 确定 性 的 算法 (参见 定理 9.5)，Las Vegas 算法 是 最 好 的 选举 算法 。Itai 和 
Rodeh[IR81] 提 出 了 已 知 规模 的 匿名 环 网 络 上 的 选举 算法 。 算 法 依赖 于 Chang-Roberts 算 法 (图 
7.3 所 示 的 算法 ) 中 使 用 的 原理 ， 但 要 使 用 该 算法 ， 必 需 对 算法 作 某 些 修改 ， 

首先 ， 因 为 Chang-Roberts 算 法 依赖 标识 信息 的 可 用 性 ， 任 何 起 着 初始 进程 作用 的 〈 匿 名 ) 
进程 p»， 随 机 地 从 集合 {1，…，N} 选 择 一 个 标识 id,。 这 使 得 比较 不 同 进程 的 令 牌 成 为 可 能 ， 
但 是 也 带 来 一 些 新 的 困难 ， 这 是 由 于 几 个 进程 可 能 具有 同一 标识 。 在 Chang-Roberts 算 法 中 ， 
当 令 牌 中 的 标识 与 进程 的 标识 一 致 时 ， 进 程 知道 它 已 经 接 到 自己 的 令 牌 ， 这 是 进程 恋 成 leader 
的 充分 条 件 。 

因为 几 个 进程 可 能 选择 同一 标识 ， 进 程 利用 令 牌 中 的 跳 数 计数 器 ， 识 别 对 自己 令 牌 的 接 
收 。 当 跳 数 等 于 N 时 ， 进 程 p 接 到 自己 的 令 牌 。 令 牌 的 接收 蕴含 ， 没 有 进程 已 经 选择 更 小 标识 。 
但 这 不 是 变 成 leader 的 充分 条 件 。 因 为 可 能 存在 另 一 个 进程 也 具有 同样 的 标识 。 为 了 检测 出 这 
种 情况 ， 每 个 令 牌 还 有 一 个 布尔 值 zn， 当 令 牌 产生 时 ， 它 的 值 为 真 ， 如 果 它 被 个 具有 相同 
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标识 的 进程 转发 时 ， 设 它 的 值 为 假 。 当 进程 接 到 自己 的 令 牌 且 un = true 时 ， 它 变 成 Jeader。 

当 进 程 接 到 自己 的 标识 且 un = falise 时 ， 出 现 困难 问题 。 这 表明 进程 的 确 有 最 小 标识 ， 但 
是 存在 另 一 具有 相同 标识 的 进程 。 具 有 最 小 标识 的 所 有 进程 可 能 接 到 它们 自己 的 令 牌 ， 并 在 
Chang-Roberts 算 法 中 “取胜 ”。 如 果 出 现 这 种 情况 ，Chang-Roberts 算 法 中 的 每 个 “获胜 者 ”， 
会 再 次 初始 化 Chang-Roberts 算 法 ， 在 更 高 一 级 开始 新 一 轮 计算 。 为 了 防止 另 一 次 的 不 分 肚 负 ， 
在 新 一 级 ， 初 始 化 下 一 级 的 每 个 进程 必须 选择 新 的 标识 。 令 牌 中 也 标明 这 个 级 别 ， 某 些 级 的 
令 有 牌 可 以 中 止 所 有 更 小 一 级 的 活动 。 

总 之 ， 如 果 进 程 p 接 收 到 自己 令 牌 时 ， 仍 处 于 cand 状 态 ， 则 它 在 chang-Roberts 算 法 中 获 
胜 。 如 果 p 是 惟一 的 效 胜 者 ， 则 它 变 成 leader， 否 则 p 在 下 一 级 初始 化 Chang-Roberts 算 法 。 如 
果 进 程 p 接 到 具有 和 较 小 标识 的 更 高 一 级 的 令 牌 或 同 级 令 牌 ， 则 进程 p 变 成 lost;， 令 牌 被 转发 。 
具有 相同 级 别 和 标识 的 令 牌 被 转发 ， 但 设置 un 为 假 。 较 低级 或 同 级 更 大 标识 的 令 牌 ， 被 清除 
( 即 中 止 它 的 转发 )。 参 见 图 9-4 所 示 的 算法 。 我 们 将 继续 证 明 算法 是 部 分 正确 的 ， 且 以 概率 1 
终止 。 


var state, : (sleep, cand, leader, lost) init sleep ; 
level, : integer init 0 ; 
idp : integer ; 
stop, : boolean init false ; 


begin if p is initiator then 
begin level, := 1 ; state, := cand ; idp := rand({1, ..., N}) ; 
send (tok, levelp, idp, 1, true) to Netty 
end ; 
while not stop, do 
begin receive a message ; (* Either a token or a ready message *) 
if it is a token (tok, level, id, hops, un) then 
if hops = N and state, = cand then 
if un then (* Become elected *) 
begin state, := leader ; send (ready ) to Next, ; 
receive (ready ) ; stop, := true 
end 
else (* There are more winners for this level *) 
begin level, := levelp + 1; idp := rand({1, ..., N}) ; 
send (tok, level,, idp, 1, true) to Nest, 
end 
else if level > level, or (level = level, and id < idp) then 
begin level, := level ; state, := lost ; 
send (tok, level, id, hops + 1, un) to Neztp 
end 
else if level = level, and id = id, then 
send (tok, level, id, hops + 1, false) to Next, 
else skip (* Purge the token *) 
else (* The message is (ready ) *) 
begin send (ready) to Nert, ; stop, := true end 





图 9-4 ITALRODEH 选 举 算法 


引 理 9.10 ”如 果 在 ! 级 ， 至 少 有 一 个 进程 产生 一 个 令 牌 ， 则 或 者 有 一 个 进程 在 那 一 级 被 先 
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中 ， 且 不 存在 进程 在 1 级 产生 令 牌 或 者 至 少 有 一 个 进程 在 1+1 级 产生 一 个 令 牌 。 

证 明 。 如 果 进 程 p 接 到 自己 的 令 牌 (1 级 )， 则 进程 p 可 以 产生 1 级 的 令 牌 。 

假设 进程 p 产 生 ! 级 的 令 牌 ， 但 它 的 标识 在 /级 所 选 的 标识 中 不 是 最 小 的 。 在 这 种 情况 下 ， 
令 牌 并 不 返回 到 p。 如 果 令 牌 没 有 被 更 高 一 级 的 进程 清除 ， 它 就 会 被 同 级 但 标识 较 小 的 进程 接 
收 ， 在 那里 它 会 被 清除 。( 观 察 可见 在 接 到 /级 的 p 的 令 牌 之 前 ， 所 有 在 /级 产生 令 牌 的 进程 都 
是 这 样 做 的 .) 由 此 可 得 ， 只 有 在 ! 级 选择 最 小 标识 的 进程 才能 在 那 一 级 当选 ， 或 者 在 级 !+1 产 
生 令 牌 。 

假设 进程 pz 产生/! 级 的 令 牌 ， 且 它 的 标识 在 ! 级 所 选 的 标识 中 是 最 小 的 。 如 果 令 牌 没有 被 更 
高 -一 级 的 进程 清除 (在 这 种 情况 下 ， 至 少 有 一 个 进程 产生 /+1 级 的 令 牌 )， 令 牌 就 会 返回 到 p。 
出 现 两 种 情况 : 或 者 p 是 ! 级 选择 最 小 标识 的 惟一 进程 ， 或 者 有 更 多 进程 选择 这 个 标识 。 在 第 
一 种 情况 下 ， 令 牌 返 回 且 un = true，P 当 选 . 在 第 二 种 情况 下 ， 令 牌 返回 且 un = false, PEE 
上 t+1 级 的 一 个 令 牌 。 口 

定理 9.11 Itai-Rodeh 算 法 (图 9-4 所 示 的 算法 ) 是 已 知 规模 环 上 的 选举 算法 ， 它 是 部 分 正 
确 的 ， 且 以 概率 1 终止 。 

证 明 。 如 果 算 法 终止 ， 且 只 有 一 个 领导 人 ， 利 用 引 理 9.10 可 证 明 它 的 部 分 正确 性 。 设 /是 
产生 令 牌 的 最 高 一 级 。 由 假设 ， 定 义 是 因为 只 考虑 有 限 计 算 。 没 有 一 个 进程 会 在 小 于 /的 级 当 
选 。 企 i+1 级 不 产生 令 牌 蕴含 着 ， 在 ![ 级 只 有 一 个 进程 当选 。 

接着 要 证 明 ， 算 法 以 概率 1 终止 。 如 果 对 于 某 级 !， 存 在 上 > 1 的 进程 ， 进 程 在 /级 产生 令 牌 ， 
存在 概率 P: > 0， 在 该 级 上 只 有 一 个 进程 选择 最 小 标识 ， 在 这 种 情况 下 ， 算 法 终止 。 设 P 是 已 
中 大 于 k 的 最 小 值 。 如 果 令 牌 在 级 产生 ， 则 令 牌 也 将 在 上 1 级 产生 的 概率 至 多 为 (1-P)。 因 此 ， 
经 过 /级 后 ， 算 法 不 终止 的 概率 为 (1-P)'， 当 起 于 无 穷 大 时 ， 它 的 极限 值 为 0。 口 

文献 HR81] 中 所 作 的 概率 分 析 ， 揭 示 出 级 的 期 望 值 界限 为 。 . N(N-1)。 每 级 消息 期 望 值 的 
FBR AOCN log N) (可 用 与 定理 7.6 中 使 用 的 类 似 证 明 给 出 )， 这 蕴含 着 算法 的 期 望 消息 复杂 
度 为 O(N log N). 

任意 网 ”利用 非常 类 似 的 想法 ， 可 给 出 任意 网 上 的 选举 算法 。 该 算法 是 基于 图 7-9 所 示 的 
算法 ， 而 不 是 基于 Chang-Roberts 算 法 。 如 果 进 程 已 经 初始 化 回 波 算法 ， 并 接 到 来 自 近邻 的 回 
波 ， 那 么 进程 在 算法 的 蘑 一 级 “取胜 ”"。 在 ltai-Rodeh 算 法 中 ， 这 不 是 变 成 领导 人 的 充分 条 件 ， 
因为 有 可 能 具有 相同 标识 的 几 个 进程 已 经 开始 选举 。 为 了 检测 出 这 种 情况 ， 由 回 波 算法 所 构 
造 的 树 的 规模 可 以 如 同 图 9-1 所 示 的 算法 计算 。 如 果 有 几 个 初始 进程 具有 相同 标识 ， 每 次 对 回 
波 算 法 的 调用 ， 都 会 构造 一 棵 只 包含 进程 子 集 的 树 。 当 进程 执行 完 回 波 算法 (通过 接收 来 自 
每 个 近邻 的 回 波 ) ， 就 可 获知 它 所 产生 的 树 的 规模 。 如 果 规 模 等 于 WN， 则 进程 当选 ， 否 则 回 波 
算法 在 更 高 一 级 被 初始 化 。 

所 得 算法 是 部 分 正确 的 ， 且 以 概率 ! 终 止 。 它 的 完整 描述 祥 见 文献 [Tel94]。 其 他 的 选举 算 
法 参见 文献 [SS89] 和 [MA89]。 


9.4 网络 规模 计算 


本 章 中 讨论 的 结果 表明 了 网 络 规模 知识 的 重要 性 。 本 节 考 虑 计算 匿名 环 规模 的 问题 。 可 
以 用 消息 -终止 算法 以 及 按 得 到 错误 解 的 非 零 概率 来 计算 环 规模 。 
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9.4.1 否定 性 结果 


本 小 节 包 含 两 个 与 计算 环 规模 相关 的 不 可 能 性 的 结果 。 证 明 思 想 与 定理 9.8 的 证 明 相 同 。 
即 ， 将 给 定 (假定 是 正确 的 ) 计算 在 更 大 环 的 不 同 部 分 重 放 。 对 于 概率 算法 ， 必 须 证 明 这 样 
的 重 放 具 有 非 堆 概率， 这 可 由 在 一 个 有 限 执行 中 ， 进 程 只 利用 它 随 机 位 序列 的 有 限 前 缀 这 样 
一 个 事实 而 得 出 。 

定理 9.12 不 存在 进程 -终止 算法 ， 以 概率 r>0 正 确 计 算 环 规模 。 

证 明 。 假 设 A 是 规模 为 N 的 环 上 的 概率 算法 。 有 Pp- 计算 Cv 。 在 Cw 中 ， 每 个 进程 p 以 result, = 
AN 终止 。 选 择 一 个 进程 P， 令 Cw 中 p 所 接收 的 消息 的 最 长 轨迹 长 度 为 K。 每 个 进程 在 Cw 中 只 能 
执行 有 限 步 。 设 L 是 计算 Cw 中 任意 进程 所 执行 的 最 大 步 数 。 

考虑 一 个 更 大 的 环 ， 它 包含 一 个 由 K+1 个 进程 形成 的 段 。 设 po 是 最 后 一 个 进程 ，p; 是 po 的 
第 i 个 逆 时 针 方向 近邻 。p' 是 环 上 进程 位 序列 的 赋值 ， 满 足以 下 性 质 。 PIAL ALS p, 的 前 ZL 位 
相间 。 对 于 i < k，p' 的 前 L 位 与 p, 的 前 L 位 相同 。q 是 在 N 环 上 p 的 第 ;个 逆 时 针 方向 近邻 。 当 将 
段 长 固定 为 K+1 时 ， 这 样 赋值 的 概率 很 小 ， 即 2-*+D。 

在 这 个 更 大 的 环 上 ， 存 在 A 的 p'- 计 算 C， 在 这 个 计算 中 ， 进 程 p; 只 发 送 与 Cy 中 p 的 第 ;个 逆 
时 针 方 向 近邻 相同 的 消息 ， 且 消息 轨迹 长 度 <K +1-i。 证 明 同 定理 9.8。 可 见 ， 对 于 任意 长 为 
K+1 的 固定 段 ， 存 在 至 少 为 2-**0 的 概率 ， 在 该 段 中 的 进程 重 放 计算 Cs。 在 这 种 情况 下 ， 进 程 
polAresult, = N 终 止 ， 这 是 不 正确 的 。 . 

在 一 个 国定 段 上 出 现 这 种 情况 的 概率 是 极 小 的 。 但 是 如 果 环 规模 很 大 ， 在 环 上 某 个 地 方 
发 生 的 概率 也 可 任意 大 。 设 给 定 概率 r > 0， 选 择 自 然 数 R， 满 足 (1-2-4) R < / 且 考 虚 环 
BUR AR ，(K+1)。 这 个 环 上 有 R 个 不 相交 县 长 为 E+1 的 和 假 ， 对 于 每 个 这 样 的 段 ， 概 率 至 多 为 
1-2-**)“， 它 的 最 后 一 个 进程 不 能 以 错误 的 解 终 止 。 由 此 可 得 ， 没 有 一 个 进程 能 够 以 错误 解 
终止 的 概率 小 于 r。 口 

利用 同样 的 论证 可 得 ， 事 实 上 ， 不 存在 非 - 常 国 数 ， 可 由 消息 -终止 算法 以 概率 r >0 正 确 
计算 出 。 下 一 个 不 可 能 性 结果 不 能 推广 到 任意 的 非 - 常 函数 。 结 果 表 明 ， 不 存在 消息 -终止 的 
Las Vegas 算 法 ， 因 此 我 们 所 能 达到 的 最 好 算法 是 消息 -终止 的 Monte Carlo 算 法 。 i 

定理 9.13 不 存在 计算 环 规模 的 消息 -终止 算法 ， 算 法 正确 的 概率 为 1 

证 明 。 假 设 4 是 规模 为 N 的 环 上 的 概率 算法 ， 有 p- 计 算 Cw。 对 某 些 进 程 p， 它 以 result, = N 
消息 -终止 。 每 个 进程 在 Cw 中 只 能 执行 有 限 步 。 设 L 是 计算 Cs 中 任 一 进程 所 执行 的 最 大 步 数 。 
在 规模 为 N 的 环 上 ， 进 程 的 编号 从 po 到 pw_)。 

考虑 规模 为 2N 的 环 ， 进 程 编 号 为 从 go 到 gaw-;。 对 位 串 的 赋值 p,， 满 足 对 于 所 有 ;i < NN， P's, 
和 pw ,的 前 位 与 p, 的 前 L 位 相同 。 构 造 规 模 为 2N 的 环 上 4 的 p 一 计算 如 下 。gi 和 giw 并 发 地 执行 
Cn 中 pi! 的 每 一 步 。 因 为 Cy 中 的 最 后 一 个 配置 是 终止 的 ， 因 此 在 Caw 中 的 最 后 一 个 计算 也 是 终止 
的 ， 在 这 个 配置 中 ， 至 少 存在 以 result, = N 的 两 个 进程 9， 这 是 不 正确 的 结果 。 

这 样 赋值 p' 的 概率 为 Zr， 它 是 正 的 ， 这 表明 4 不 能 以 大 于 1-2-w 的 概率 正确 计算 环 规 








模 。 











进程 -终止 或 者 消息 -终止 算 东 正确 性 的 概率 之 间 的 差异 非 形式 地 解释 如 下 。 如 果 某 一 不 
幸 的 随机 选择 出 现在 环 上 的 某 处 ， 则 进程 -终止 算法 给 出 不 正确 的 结果 。 当 环 规模 变 大 时 ， 发 
生 这 种 情况 的 概率 增加 。 在 消息 -终止 算法 中 ， 造 成 那 种 不 幸 选择 的 进程 总 是 有 从 它们 的 不 正 
确 解 恢复 过 来 的 可 能 性 ， 如 果 它们 接 到 来 自 其 他 进程 的 信息 。 因 此 ， 如 果菜 一 不 幸 的 随机 选 
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择 出 现在 环 上 的 每 处 ， 消 息 -终止 的 算法 会 给 出 不 正确 的 结果 。 尽 管 不 能 永远 排除 这 种 情况 ， 
但 是 发 生 这 种 情况 的 概率 是 有 界 的 ， 实 际 上 ， 当 环 规模 变 大 时 ， 发 生 这 种 情况 的 概率 减 小 。 


9.4.2 计算 环 规模 的 算法 


本 小 节 讨 论 计 算 环 规模 的 消息 -终止 Monte Carlo 算 法 。 可 以 证 明 ， 当 算法 终止 时 ， 对 于 
所 有 p， 算 法 以 某 一 概率 满足 est, = N， 且 可 以 通过 选择 算法 中 的 参数 R， 使 得 该 概率 任意 大 。 
算法 与 1tai 和 Rodeh [IR81] 给 出 的 算法 类 似 ， 但 稍微 有 些 简化 。 

进程 p 维 持 局 部 对 环 规模 的 估算 (estimate )，est,， 保 证 任何 时 刻 这 个 估算 值 是 守恒 的 ， 
Blest, < N。 初 始 时 ，esm = 2。 当 p 接 收 的 信息 董 含 着 ，esz 不 等 于 环 规模 时 ， 就 增加 该 估 
算 值 。 

为 了 获得 正确 估算 的 可 靠 性 ， 进 程 p 产 生 一 个 令 牌 并 在 环 上 发 送 est, 次 。 如 果 读 估算 值 
是 正确 的 ，p 接 收 自己 的 令 牌 。 如 果 发 生 这 种 情况 ，p 将 暂时 得 到 满足 ， 并 不 采取 进一步 的 行 
动 。 在 N 实 际 上 大 于 esz 时 ， 进 程 p 接 收 类 似 的 令 牌 ， 但 是 z 的 第 esz 个 逆 时 针 近 邻 具 有 相同 的 佑 
算 值 ， 并 且 也 产生 一 个 令 牌 。 

可 以 以 大 概率 检测 出 这 种 情况 ( 即 进程 p 接 收 的 不 是 自己 的 令 牌 )， 每 个 进程 从 {1，…， 
R} 中 随机 选择 一 个 标号 ， 并 将 它 包含 在 令 牌 中 。 只 要 p 的 估算 值 不 增加 ，p 的 标号 保持 不 变 。 
如 果 p 接 到 来 自 另 一 个 进程 的 令 牌 ， 则 令 牌 中 所 包含 的 标号 不 同 于 p 的 标号 的 概率 为 1-1/R。 如 
果 进 程 接 到 自己 的 令 牌 ， 则 这 两 个 标号 一 定 完 全 一 样 。 

进程 p 按 照 以 下 两 种 情况 增加 它 的 估算 值 。 

(1) 进程 接 到 一 个 令 牌 ， 其 所 含 的 esf > es1,， 因 为 保证 所 有 估算 值 都 是 守恒 的 ， 该 令 牌 的 
FEW EES GN > esi,。 

(2) 当 接 到 估算 值 est = estp 的 令 牌 时 ， 这 个 令 牌 已 经 做 过 est 次 跳跃 ， 但 是 它 所 包含 的 标 
号 不 同 于 p 的 标号 。p 的 第 (est) 个 逆 时 针 近 邻 产 生 这 个 令 牌 。 其 后 的 进程 标号 不 同 于 p 的 进程 
标号 。 从 而 ，p 的 第 (est) MBM ENE BA Fp. Ait, Nx est. 

具有 est < esi, 的 令 牌 被 清除 ( 即 中 止 它 的 传播 )， 参 见 图 9-5。 

引 理 9.14 算法 在 交换 O(N3) 条 消息 后 ， 消 息 -终止 。 在 终止 配置 中 ， 所 有 esi, 都 相等 ， 
它们 的 共同 值 的 上 限 为 N， 即 对 于 所 有 p 和 4g，est, = est, < N, 

证 明 。 证 明 终止 性 的 关键 步 又 是 证 明 计算 值 是 守恒 的 。 观 察 可 见 ， esbp 从 不 减少 ， 仅 当 
est, mit, (bl, FAE. 这 蕴含 着 只 要 p 的 令 牌 <test，est，ibl， A> 循 环 传递 ， 旦 esf = est, MI 
lbl, = lbl。 利 用 这 一 点 ， 可 用 归纳 法 证 明 ， 计 算 的 所 有 值 是 守恒 的 。 

因为 令 牌 中 所 找到 的 估算 值 就 是 进程 的 计算 值 ， 只 需 考虑 由 进程 对 估算 值 的 计算 ， 它 发 
生 在 以 下 三 种 情形 。 

(1) 进程 一旦 接 到 带 有 估算 值 est 的 令 牌 ， 可 能 将 esm 增 加 到 est。 但 因 这 个 值 被 较 早 进行 
计算 ， 按 归纳 假设 ， 它 是 守恒 的 。 

(2) 进程 p 一 旦 接 到 带 有 估算 值 esr， 且 跳 数 为 est 的 令 牌 ， 可 能 将 esm 增 加 到 est+1。 在 这 种 
情况 下 ， 由 归纳 法 可 得 ，est 是 守恒 的 ， 有 HN # esi， 因为 令 牌 的 初始 进程 跳 数 为 est， 不 等 于 p。 

(3) 最 后 ， 进 程 p 一 旦 接收 带 有 est = h = est,， 但 是 1bl + 1b1, 的 令 牌 ， 可 能 将 est, 增 加 到 
estt+1。 令 牌 的 初始 进程 跳 数 为 est 步 远 ， 在 这 种 情形 ， [bl + 1 蕴含 初始 进程 不 等 于 p。 再 次 区 
含 着 N + est, esth FERSEN > est, 
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cons R : integer ; (* Determines correctness probability *) 


var est, : integer ; 
lbl, : integer ; 


begin est, := 2 ; lol, := rand({1, ..., R}) ; 
send (test, estp, lblp, 1) to Next, : 
while true do 
begin receive (test, est, lbl, h) ; 
if est > est, then (+ p’s estimate must increase *) 
if est = h then (* est is also too low 9 
begin est, := est +1 ; lbly := rand({1, . ., RJ); 
send (test, estp, bl, 1) to Nezt, 
end 
else (* forward token and increase est, *) 


begin send (test, est, lbl, h +1) to Nezty ; 
estp := est ; lblp := rand({1, ..., R}) ; 
send (test, ‘est, Ibl,,1) to Next, 


end 
else if est = est, then 
if h < est then send (test, est, lbl,h +1) to Nezty 
else (* This token has made est hops *) 
if lbl # ibl, then 
begin esty =est+1; 
ibl, := = rand({1, . BY) ; 
send (test, estp , bly, 1) to Nest, 
end 


else skip  (* Possibly p’s token returned *) 
else (* est < est, *) skip 


图 9-5 概率 计算 环 规模 


每 个 进程 产生 少 于 N 个 不 同 令 牌 ， 即 值 从 2 到 N。 估 算 值 为 e 的 令 牌 至 多 被 转发 e 个 跳 数 。 这 
蕴含 着 消息 复杂 度 为 O(M)。 如 果 进 程 p 使 esz, 增 加 到 e，pP 向 Nexz, 发 送 包含 值 e 的 令 牌 ， 一 旦 接 
”到 这 个 令 牌 ， eStnex, 值 至 少 为 e， 因 此 在 终止 配置 中 ， estwemm> estp。 这 对 于 所 有 p 成 立 。 这 理 含 
着 所 有 估算 值 相同 。 前 面 已 经 证 明 ， 它 们 的 值 小 于 N。 q 

定理 9.15 对 于 所 有 P， 图 9-5 所 示 的 算法 至 少 以 概率 1 一 (N-2) (1R) 和 ?终止 ,一 旦 终止 ， 
est, =N, 

证 明 。 按 照 引 理 9.14， 算 法 终止 于 一 个 配置 ， 在 这 个 配置 中 ， 所 有 估算 值 相同 ， 称 为 e， 
假设 e < W。 按 照 顺 时 针 方向 对 进程 命名 ， 从 po 到 pv， 。 

Sik Hest, 的 值 为 e 时 ， 进 程 P， 选择 标号 1bl, ， 并 产生 令 牌 <test，e，1b1,，h>。 这 个 令 牌 被 
HG eT PER. Bip MI Be MEU SB... piei T CM, 并 不 进一步 增加 它 的 值 。 这 
蕴含 着 对 于 所 有 i，lbi,, = Ilys. Bef = gcd(N, e), 利用 等 式 1b1。= lbls, 可 得 ， 当 i 和 /相差 /的 
倍数 时 ， pj 和 pj 所 选 的 标号 是 相同 的 ， a, 


FIG -i= ibl, = lbl,, 


进程 po 到 pw-, 被 划分 成 /组 ， 每 组 有 N/f 个 进程 。 同 组 中 的 所 有 进程 具有 相同 标号 。 
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但 由 于 标号 可 从 {1，…，R} 中 随机 选取 ， 同 组 所 有 进程 选择 同一 标号 的 概率 是 
(UR), ERAS 组 中 发 生 这 种 情况 的 概率 仅 为 (HR) OD = (LUR)Y7。 对 于 e 的 所 有 可 能 
值 ， /至 多 为 W2， 对 所 有 可 能 的 不 正确 解 的 概率 求 和 (从 2 至 N-1)， 得 到 正确 解 的 概率 译 少 是 
1-(N-2) (L/R)w2。 口 





习题 
9.1 节 


9.1 设 W 是 后 置 条 件 ， 假定 

(1) 终止 于 Monte Carlo- AA ER ARY, A 

(2) — AR. EAR RA BANYA T AZ., 

如 何 构造 Las VegasH ACAR yp ? 

9.2 RYAGHARH, RikywLas Vegas 算法 4 确定 。 已 知 由 4 交换 的 消息 的 期 望 数 开 。 
构造 确定 多 的 Monte Carlo 算 法 ， 该 算法 以 错误 概率 E 为 参数 ( 即 算法 必须 终止 且 正 确 ， 概 率 
为 1-e)。 

9.3 给 出 一 个 确定 、 集 中 式 的 命名 周 值 算法 ， 算 法 利用 21EI 条 消息 和 O(D) 个 时 间 单 

9.4 [Ang80] 给 出 团 上 的 确定 选举 算法 ， 其 中 的 通信 方式 采用 同步 消息 传递 。 

9.5 给 出 环 上 计算 MAX 的 确定 、 消 息 -终止 的 算法 。 给 出 规模 未 知 的 任意 网 上 计算 MAX 
的 确定 、 消 息 -终止 的 算法 。 

9.6 考虑 未 知 规模 的 匿名 树 上 的 选举 问题 ， 其 中 的 通信 方式 采用 异步 消息 传递 。 

(1) 给 出 以 概率 1、 部 分 正确 的 进程 终止 的 随机 算法 。 且 算 法 的 期 望 消息 复杂 度 为 O(N )。 
(实际 上 ， 期 望 消息 复杂 度 可 达到 N+1。) 

(2) 在 这 种 情况 下 ， 存 在 确定 算法 吗 ? 

9.2 节 

9.7 证 明 不 存在 计算 进程 数 的 确定 算法 ， 对 于 所 有 直径 至 多 为 2 的 匿名 网 络 都 是 正确 的 。 

提示 : 利用 图 6.21 中 网 络 的 对 称 性 。 

9.8 ”证 明 不 存在 已 知 环 (即使 规模 已 知 ) 上 的 确定 选举 算法 ， 其 中 的 通信 方式 采用 同步 
消息 传递 。 

概述 证 明 过 程 ， 证 明 对 于 所 有 组 合 环 规模 上 的 选举 问题 ， 选举 算法 的 不 可 能 性 。 

9.9 定义 整数 事 x = (x, , me) LORS, RMAs, N(x) BH: & A f(x) 
为 假 。 对 于 未 知 规模 的 环 ， 三 可 以 被 进程 终止 算法 确定 地 计算 吗 ? 对 于 规模 未 知 的 环 ， FTV 
被 消息 终止 算法 确定 地 计算 吗 ? 

9.10 ”问题 同 习题 9.9， 但 是 函数 不 同 ， 如 果 x 有 非 降 御 环 移动 ， 则 8(x) HRP A Ark 
环 移动 z， 满 足 g <j 二 zi < zh 

9.3 节 


9.11 给 出 已 知 规模 的 匿名 环 上 的 进程 -终止 的 Monte Carlo 选 举 算 法 ， 你 所 设计 的 算法 的 
消息 复杂 度 是 多 少 ? 算法 成 功 的 概率 是 多 大 ? 
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可 能 达到 任意 接近 1 的 成 功 概 率 吗 ? 

伪 - 匿 名 网 络 (pseudo-anonymous network) 是 这 样 的 网 络 : 进程 具有 标识 ， 但 标识 不 必 
都 不 相同 。 伪 -匿名 环 〈《 如 ， 进 程 Po 到 pw-,) EAR, WREE <N, REX TATA, id; 
= Idiske 

9.12 证 明 在 已 知 规模 的 非 周期 伪 匿 名 环 上 ， 存 在 确定 、 进 程 终止 的 选举 算法 。 

9.13 ”证 明 在 未 知 规模 的 非 周期 伪 匿 名 环 上 ， 不 存在 随机 、 进 程 终 止 且 以 正 概率 正确 的 
选举 算法 。 


Ww 
Lee) 
we 


9.45 
9.14 函数 8 的 定义 同 习题 9.10。 给 出 未 知 规模 的 环 上 计算 函数 8 的 随机 、 消 息 终止 的 算法 ， 
且 该 算法 以 概率 1-e 正 确 。 
9.15 利用 Safra 的 终止 -检测 算法 (图 8-7 所 示 的 算法 ) 能 够 检测 出 Itai-Rodeh 算 法 (图 9- 
5 所 示 的 算法 ) 的 终止 性 吗 ? 334 
你 能 想 出 曾经 讨论 过 的 用 于 此 目的 的 其 他 终止 检测 算法 吗 ? 
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到 目前 为 止 我 们 考虑 的 算法 (第 8 章 中 的 算法 除外 ) 所 执行 的 任务 ， 都 与 网 络 结构 或 者 全 
局 网 络 功能 有 关 。 本 章 我 们 要 讨论 的 算法 ， 其 任务 是 分 析 通 常 由 其 他 算法 所 引起 的 计算 性 质 。 
然而 ， 令 人 吃惊 的 是 ， 从 分 布 式 系统 内 部 ， 我 们 很 准 了 解 这 个 系统 的 计算 。 在 进行 系统 计算 
的 算法 设计 时 ， 计 算 和 存储 该 计算 的 某 个 配置 的 过 程 ， 即 所 谓 的 快照 (snapshot)， 是 重要 的 
基本 任务 。 

按照 定义 2.22， 可 以 用 不 同 配置 序列 描述 分 布 式 计算 ， 这 个 配置 序列 包括 不 同 配置 集 。 因 
此 考虑 哪个 配置 作为 计算 的 配置 并 不 是 显而易见 的 。 在 10.1 节 中 ， 将 论述 这 个 问题 ， 其 中 把 
割 、 一 致 割 及 快照 的 概念 放 在 一 起 。 这 些 概念 与 第 2 章 中 定义 的 因果 关系 有 紧密 的 联系 。 

一 些 应 用 促进 了 快照 的 出 现 。 这 里 我 们 列举 三 个 。 

第 一 ， 可 以 对 在 某 个 配置 内 部 所 反映 的 计算 性 质 ， 用 一 个 观察 (固定 的 ) 快照 而 不 是 观 
察 〈《 变 化 的 ) 实际 进程 状态 的 算法 ， 做 离线 分 析 。 这 些 性 质 包 括 稳定 性 质 。 配 置 的 一 个 性 质 P 
是 稳定 的 ， 如 果 


P(Y) AY ~ ô= P(6d) 


简单 地 说 ， 如 果 计 算 到 达 使 P 成 立 的 配置 "， 从 那 时 起 ， 在 每 个 配置 6 中 ，P 保 持 为 真 。 因 
而 ， 如 果 在 计算 的 一 次 快照 中 ， 发 现 P 为 真 ， 那 么 对 于 从 那 时 起 的 所 有 配置 ， 可 以 得 出 P 都 为 
真 。 稳 定性 质 的 例子 有 终止 、 死 锁 、 令 牌 委 失 以 及 动态 存储 结构 中 对 象 的 不 可 达 性 。 

第 二 ， 如 果 由 于 进程 故障 计算 必须 重新 开始 ， 可 以 使 用 快照 而 不 是 初始 配置 。 这 样 ， 在 
快照 中 所 捕获 的 进程 p 的 局 部 状态 c" 在 那个 进程 中 恢复 。 此 后 算法 继续 运行 。 

第 三 ， 在 调试 分 布 式 程序 时 ,快照 是 有 用 的 工具 。 对 于 取 自 错误 执行 的 配置 的 离线 分 析 
可 能 揭示 出 程序 的 行为 为 什么 不 像 期 望 的 那样 。 


10.1 预备 知识 


设 C 是 分 布 式 系统 的 计算 ， 由 进程 集合 P 组 成 。Ev 表 示 计 算 的 事件 集 。 我 们 做 出 弱 公 平 性 
假设 ,每 条 消息 将 在 有 限时 间 内 被 接收 。 假 设 网 络 是 ( 强 ) 连通 的 。 进 程 p 的 局 部 计算 由 进程 
状态 cy”. cD, FFB, Hp c 是 进程 p 的 初始 状态 。 用 进程 p 中 的 事件 e 的 发 生来 标 
记 从 状态 cl? 到 状态 cP 的 转移 。 参 见 图 10-1。 因 此 , Ev=U,ep{ ep eP, ey 


(i) 


0 i 
pf) Po gad 
to 4 (i) | tary 
初始 状态 取 快 照 
图 10-1 进程 p 的 计算 


在 进程 p 的 事件 中 ， 定 义 局 部 因果 序 (local causal order) 如 下 
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人 J) eo; 
p wis] 


每 个 事件 是 发 送 事 件 、 接 收 事件 或 内 部 事件 之 一 。 参 见 第 2 章 中 的 定义 。 为 了 简化 本 章 中 
算法 和 定理 的 表示 ， 我 们 暂时 假设 进程 的 整个 通信 历史 被 反映 在 它 的 状态 上 。 即 如 果 存 在 从 P 
到 4 的 信道 ， 那 么 ，p 的 状态 c) 包括 在 事件 cf) 至 事件 e? 中 p 已 向 gq 发 送 的 消息 列表 sent? 。 同 
时 ，g 的 状态 ce? 包括 在 事件 ey 至 事件 c% 中 4 已 接收 p 的 消息 列表 revd? 。 为 了 避免 在 算法 的 
应 用 中 对 通信 历史 的 明确 存储 ， 在 10.3.1 小 节 中 ， 表 明了 如 何 撤消 这 个 假设 。 

快照 算法 的 目标 是 通过 组 合 每 个 进程 的 局 部 状态 (快照 状态 )， 明 确 地 构造 系统 配置 。 
进程 p 通 过 存储 一 个 局 部 状态 c。， 取 得 局 部 快照 (local snapshot), BR e 为 p 的 快照 状态 
(snapshot state )。 如 果 快照 状态 是 c" ， 即 p 取 得 事件 em 和 事件 cg 之 间 的 快照 ， 则 事件 e, 
j < 1， 称 为 p 的 前 照 事 件 〈preshot event) ; 事件 eH，j > i， 称 为 p 的 后 照 事 件 (postshot 
event)。 在 时 间 图 中 , 我 们 在 进程 状态 变 成 快照 状态 的 位 置 用 一 个 空心 圆 说 明 局 部 快照 的 获取 ， 
如 图 10-1 和 10-2 所 示 。 


图 10-2 不 一 致 的 快照 

(全 局 ) 快照 5* 由 集合 P 中 每 个 进程 p 的 快照 状态 ;组 成 ， 记 为 s+ (ch … Cw )。 因 为 
局 部 状态 包括 通信 历史 ， 如 果 信 道 pq 的 状态 定义 为 p 所 发 送 ( 根 据 c; ) 但 不 由 4 接收 (根据 <; ) 
的 消息 集 ， 那 么 快照 5+ 定义 了 一 个 配置 yr。 换 句 话 说 ， 信 道 pg 在 快照 5* 中 的 状态 定义 为 消 
B sent, \ revdm 集 。 用 六 表示 由 快照 状态 和 定义 的 信道 状态 组 成 的 配置 。 

在 构造 配置 的 过 程 中 ， 如 果 revd), 不 是 sent, 的 子 集 ， 就 会 引起 异常 情况 。 参 见 图 10-2。 
按照 所 收集 的 快照 状态 c ， 己 向 P; 发 送 消息 ， 但 是 按照 状态 c，， 没 有 来 自 pi 的 消息 被 接收 。 
因此 ， 信 道 Pi 包含 快照 中 的 一 条 信息 ， 称 这 条 消息 在 快照 中 “在 传输 中 "。 现 在 考虑 从 p 发 向 
Pp: 的 消息 。 这 条 消息 的 发 送 是 一 个 后 照 事件 ， 而 它 的 接收 是 一 个 前 照 事件 。 因 此 ， 按 照 状 
态 c%， 在 信道 pips 上 没有 消息 发 送 。 但 是 根据 状态 c;, ， 经 此 信道 有 消息 被 接收 。 因 为 reva* 。 
了 Zsent;。。， 对 于 信道 pip: 的 状态 不 能 做 出 有 意义 的 选择 。 受 此 启发 ， 产 生 以 下 定义 。 


定义 10.1 如 果 对 于 每 两 个 (近邻 ) 进程 p 和 g， 有 rcvdis © Sentor， 那 么 称快 照 8+ 是 可 行 的 。 

快照 的 可 行 性 意味 着 ， 在 所 蕴含 的 配置 的 构造 过 程 中 ,，“ 保 留 ” 在 rcydx 中 的 消息 都 能 从 
Sentre 中 被 删除 。 如 果 在 前 照 事件 中 发 送 一 条 消息 ， 那么 我 们 称 这 条 消息 为 前 照 消 息 (preshot 
message) ; 如 果 在 后 照 事 件 中 发 送 一 条 消息 ， 那么 我 们 称 这 条 消息 为 后 照 消息 (postshot 
message). 

在 计算 的 事件 集合 中 ， 快 照 和 有 限 割 (cut) 存在 一 一 对 应 关系 。 割 是 事件 集 ， 对 于 局 部 
因果 关系 ， 它 是 左 闭合 的 。 

定义 10.2 Ev 的 割 是 集合 L C Ev, HR 
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如 果 C Lop, MHALABWLZE. 

一 方面 ， 对 于 每 个 快照 s* ， 很 容易 把 前 照 事 件 的 集合 ZL 看 作 一 个 有 限制 。 另 一 方面 ， 设 忆 
是 有 限制 ， 对 于 每 个 进程 p?， 或 者 p 中 没有 一 个 事件 包含 在 L 中 (在 这 种 情况 下 ， 设 m, = 0)， 
或 者 有 一 个 最 大 事件 e。” 包 含 在 L 中 ， 并 且 所 有 满足 e x, r 的 事件 也 包含 在 L 中 。 于 是 ，L 


恰好 是 由 S* = (Cp sC) 所 定义 的 快照 的 前 照 事件 集 。 

快照 可 用 于 导出 关于 计算 的 信息 ， 由 此 计算 得 到 快照 ， 但 是 任意 获取 的 一 个 快照 几乎 不 
能 提供 关于 这 个 计算 的 信息 。 作 为 例子 ， 考 虑 基于 单个 令 牌 传递 的 算法 ， 如 6.3 节 的 遍历 算法 。 
假设 进程 p 持 有 令 牌 时 获取 它 的 快照 ，-- 段 时 间 后 ， 当 进程 g 持 有 令 牌 时 也 获取 它 的 快照 。 在 
所 构造 的 配置 中 ， 两 个 进程 都 持 有 令 牌 ， 这 正 是 在 算法 的 任何 计算 中 ， 从 未 发 生 的 情况 。 

凭 直觉， 我 们 希望 快照 算法 能 够 计算 出 “实际 出 现 ”的 一 个 配置 。 然 而 ， 令 人 遗憾 的 是 ， 


所 出 现 的 配置 集合 并 不 是 等 价 不 变 式 ， 如 在 2.3.2 小 节 中 证 明 的 那样 ， 因 而 它 不 能 被 定义 来 用 


于 计算 。 因 此 我 们 会 将 计算 中 可 能 的 任何 配置 (例如 ,发 生 在 计算 的 某 些 执行 中 ) ， 作 为 算法 
有 意义 的 输出 。 

定义 10.3 ”如果 存在 一 次 执行 下 EC， 满 足 人 # 是 巨 的 一 个 配置 ， 那 么 称快 照 S* 在 计算 C 中 是 
有 意义 的 。 

我 们 要 求 快照 算法 可 以 协调 局 部 快照 配置 ， 使 得 全 局 快照 是 有 意义 的 。 在 10.3.2 小 节 讨 论 
快照 的 适时 性 。 

快照 的 可 行 性 只 强加 了 近邻 的 局 部 快照 之 间 的 关系 ， 而 更 有 意义 的 是 快照 的 全 局 性 质 。 
以 下 还 可 证 明 (定理 10.5)， 具有 可 行 性 的 快照 是 有 意义 的 ， 反 之 亦 然 。 同 时 这 些 快照 与 一 致 
割 相 对 应 。 称 割 是 一 致 的 ， 如 果 它 关于 因果 关系 是 左 闭合 的 。 

定义 10.4 Ev 的 一 致 割 是 一 个 集合 L CE, BHR 


eELAe' sese EL 


定理 10.5 ESRR, LAS*HRS HE, UF LH ARES, 

(1) 5S* 是 可 行 的。 

(2) L-AN. 

(3) S* 是 有 意义 的 。 

证 明 。 我 们 证 明 (1) 蕴含 着 (2)、(2) BEB (3) 和 G) RSH (1)。 

先 证 明 (1) 蕴含 着 (2)。 假 设 $* 是 可 行 的 ， 为 了 证 明 L 是 一 致 的 ， 取 e E LHe se, 
由 < 的 定义 ， 只 需 证 明 e' EL 在 以 下 两 种 情况 下 成 立 

(1) e <,e (其 中 p 是 e' 和 e 发 生 时 的 进程 )， 在 这 种 情况 下 ， 由 于 L 是 割 ， 可 得 e' EL, 

(2) e' 是 发 送 事件 ，e 是 相应 的 接收 事件 设 p 是 事件 e' 发 生 时 的 进程 ，g 是 事件 e 发 生 时 的 
进程 ，m 是 在 这 些 事件 中 交换 的 消息 。 现 在 


e EL 二 mE rcvd',, 因 为 e 是 前 照 事 件 
=> m & senf'po 因 为 S$* 是 可 行 的 
=e EL 


(2) HRE (3)。 证 明 的 关键 是 构造 一 次 执行 ， 在 这 次 执行 中 ， 所 有 前 照 事件 在 所 有 后 
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照 事 件 之 前 发 生 。 

ef = (fo 有，…) 是 Ev 的 枚 举 ， 定 义 如 下 。 首 先 ，f 按照 与 < 一 致 的 次 序列 出 了 Ev 中 的 
所 有 前 照 事件 ， 然 后 ,按照 与 < 一 致 的 次 序列 出 了 后 照 事件 ， 如 图 10-3 所 示 。 为 了 应 用 定理 
2.21， 必 须 证 明 ， 整 个 序列 /与 < 一 致 。 设 fi < f， 如 果 f: 和 f 都 是 前 照 事 件 ， 因 为 /按照 与 < 一 
致 的 次 序 枚 举 了 前 照 事件 ， 由 此 可 得 ，i < j。 如 果 ff 都 是 后 照 事 件 ， 同 样 成 立 。 如 果 f 是 前 
申 事 件 而 /是 后 照 事件 ， 因 为 /包含 的 所 有 前 照 事件 在 所 有 后 照 事 件 之 前 ， 由 此 可 得 ，f < j。 
通过 假设 割 ! 是 一 致 的 ， 可 以 排除 /是 前 照 事件 而 /是 后 照 事件 的 情况 ; 即 如 果 六 EL 有 AP < f, 
那么 fi: EL， 即 f 是 前 照 事件 。 我 们 可 以 得 出 结论 ，f 与 < 是 一 致 的 。 

由 定理 2.21， 存 在 执行 ， 由 Ey 中 的 事件 组 成 ， 按 照 次 序 /出 现 。 在 所 有 前 照 事件 执行 后 ， 
执行 Ff 立即 包含 配置 y*。 

(3) 冀 含 着 (1)。 如 果 5* 是 有 意义 的 ，yx* 出 现在 C 的 一 次 执行 中 。 在 每 次 执行 中 ， 消 息 在 





接收 之 前 被 发 送 ， 这 蕴含 着 ， 对 于 每 个 p 和 9，rcvd'w C senr',,。。 因 此 5* 是 可 行 的 。 口 
C 的 时 空 图 
序列 / 
图 10-3 执行 F 


10.2 两 个 快照 算法 


由 定理 10.5， 是 以 协调 局 部 快照 的 配置 ， 来 确保 所 得 快照 是 可 行 的 。 这 可 以 把 对 快照 算法 
的 要 求 简化 为 以 下 两 个 性 质 。 

(1) 在 每 个 进程 中 必须 触发 对 局 部 快照 的 获取 。 

(2) 在 前 照 事 件 中 不 接收 后 照 消 息 。 

在 所 有 快照 算法 中 ， 保 证 在 接收 后 照 消息 之 前 ， 进 程 获 取 其 快照 。 本 节 的 两 个 算法 ， 在 
如 何 识别 这 些 消息 以 及 如 何 保证 每 个 进程 获取 快照 这 两 方面 有 所 不 同 。 

为 了 正确 区 别 快照 算法 中 的 消息 和 计算 中 的 消息 ， 称 快照 算法 中 的 消息 为 控制 消息 ， 计 
算 中 的 消息 为 基本 消息 。 


10.2.1 Chandy-Lamport 算 法 


在 本 小 节 中 ， 假 设 信道 是 fifo 的 ， 即 经 过 某 一 信道 发 送 的 消息 ， 以 与 发 送 顺序 相同 的 次 序 
被 接收 。 在 Chandy-Lamport [CL85] 算 法 中 ， 进 程 通过 每 个 信道 发 送 特殊 的 消息 <mkr> (标记 
消息 (marker))， 相 互通 知 所 构造 的 快照 。 当 进程 获取 它 的 局 部 快照 时 ， 经 过 各 近邻 信道 ， 
每 个 进程 只 发 送 一 次 标记 消息 ， 标 记 消息 是 控制 消息 。 还 未 获取 快照 的 进程 接 到 <mkr> 消 息 ， 
会 引起 该 进程 取得 快照 ， 同 时 发 送 <mkr> 消 息 。 参 见 图 10-4 所 示 的 算法 。 算 法 在 计算 C 上 并 发 
执行 。 
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var taken, : boolean init false ; 


To initiate the algorithm: 
begin record the local state ; taken, := true ; 
forall q € Neigh, do send (mkr) to q 


end 


If a marker has arrived: 
begin receive (mkr) ; 
if not taken, then 
begin record the local state ; takenp := true ; 
forall q € Neigh, do send (mkr) to q 





图 10-4 Chandy-Lamport 快 照 算法 


引 理 10.6 如 果 至 少 有 一 个 进程 开始 执行 算法 ,那么 在 有 限时 间 内 ， 所 有 进程 取得 局 部 快 
ag 

证 明 。 因 为 每 个 进程 取得 快照 和 发 送 消息 <mkr> 至 多 一 次 。 快 照 算法 的 活动 在 有 限时 间 
内 停止 。 如 果 p 是 那 时 已 经 取得 快照 的 一 个 进程 ， 且 4 是 p 的 近邻 ， 那 么 9 也 已 经 取得 快照 。 这 
是 由 于 p 所 发 送 的 消息 <mkr> 已 经 被 "接收 到 ， 如 果 4 还 未 取得 快照 的 话 ， 会 导致 它 取得 快照 。 
因为 至 少 有 一 个 进程 初始 化 算法 ， 则 至 少 有 一 个 进程 已 经 取得 快照 。 网 络 的 连通 性 蕴含 着 所 
有 进程 都 已 取得 快照 。 口 

观察 可 见 ， 算 法 必须 被 至 少 一 个 进程 初始 化 ， 但 是 如 果 算 法 由 任意 非 空 进程 集 初始 化 ， 
它 也 能 正确 工作 。 l 

定理 10.7 在 至 少 有 一 个 进程 初始 化 算法 之 后 , Chandy-Lamport 算 法 (图 10-4 所 示 的 算法 ) 
在 有 限时 间 内 计算 有 意义 的 快照 。 

证 明 。 由 前 述 引 理 ， 算 法 在 有 限时 间 内 计算 快照 。 接 下 来 要 证 明 所 得 快照 是 可 行 的 ， 即 
在 后 照 事件 中 接收 每 个 后 照 (基本 ) 消息 。 设 m 是 p 发 送 给 q 的 后 照 消息 。 在 发 送 m 之 前 ，p 取 
得 局 部 快照 ， 并 把 消息 <mkr> 发 送 到 所 有 它 的 近邻 中 ， 包 括 q。 因 为 信道 是 fifo 的 ，g 在 m 之 前 
接 到 这 个 消息 <mkr>， 按 照 算法 ，gq 一 旦 接 到 这 个 消息 ， 就 取得 它 的 快照 。 因 此 ，m 的 接收 是 
后 照 事件 。 口 

每 个 进程 中 ，Chandy-Lamport 算 法 需要 交换 2 . IBI 条 <mkr> 消 息 ， 需 要 一 位 存储 空间 ( 当 
然 ， 加 上 所 记录 的 快照 状态 )。 它 的 时 间 复 杂 度 为 0(DD)。 








10.2.2 Lai-Yang 算 法 


Lai-Yang [LY87] 算 法 并 不 依赖 信道 的 fifo 性 质 。 因 此 ， 该 算法 不 可 能 像 在 Chandy-Lamport 
算法 中 所 作 的 那样 ， 利 用 标记 消息 就 能 将 前 照 消息 和 后 照 消 息 “ 分 开 ”。 而 是 在 每 个 基本 消息 
中 用 表明 它 是 前 照 事件 还 是 后 照 事 件 的 信息 做 出 标记 。 因 此 ， 发 送 C 中 一 条 消息 的 进程 p， 将 
taken, 的 值 追 加 在 其 后 。 由 于 在 这 里 不 关心 的 消息 c 的 内 容 ， 我 们 把 这 些 消息 简单 的 表示 为 
<mes，c>， 甚 中 < 是 发 送 进程 中 所 包含 的 teken 的 值 。 快 照 算法 在 接 到 第 一 条 快照 消息 之 前 ， 
检查 进来 的 消息 ， 并 记录 它 的 局 部 状态 。 参 见 图 10-5 所 示 的 算法 。 
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var taken, : boolean init false ; 


To initiate the algorithm: 
begin record the local state ; taken := true end 


To send a message of C: 
send (mes, taken, ) 


If a message (mes,c) has arrived: 
begin receive (mes,c) ; 
if c and not taken, then 
begin record the local state ; taken := true end ; 
change state as in the receive event of C 
end 








图 10-5 Lai-Yang 快 照 算法 


图 10-5 不 交换 控制 消息 ， 但 并 不 确保 每 个 进程 最 终 记 录 它 的 状态 ， 可 能 确实 做 不 到 这 一 
点 。 考 虑 进程 p， 它 不 是 快照 算法 的 初始 进程 ， 假 设 p 的 近邻 在 取得 它们 的 局 部 快照 之 后 ， 并 
没有 向 p 发 送 消息 。 在 这 种 情况 下 ，P 从 不 记录 它 的 状态 。 快 照 算法 以 不 完整 的 快 申 终 止 。 

解决 这 个 问题 依赖 于 对 计算 C 的 了 解 。 如 果 与 每 个 进程 的 最 终 通信 得 到 保证 ， 将 总 能 获得 
完整 的 快照 。 否 则 ， 如 果 初 始 时 需 交 换 所 有 进程 中 的 控制 消息 ， 就 要 对 算法 进行 扩充 ， 正 如 图 
10-4 的 算法 所 示 。 因 而 这 些 消息 仅 保证 , 每 个 进程 最 终 记录 它 的 状态 (如 引 理 10.6 中 所 证 明 的 )， 
但 在 证 明 所 得 快照 的 可 行 性 方面 不 起 作用 。 不 论 是 哪 种 方法 ， 都 可 以 保证 完整 快照 的 计算 。 

定理 10.8 Lai-Yang 算 法 (图 10-5 所 示 的 算法 ) 只 能 计算 有 意义 的 快 眼 。 

证 明 。 考 虑 由 算 东 计算 的 -- 个 快照 。 设 m = <mes，c> 是 从 p 发 送 到 g 的 后 照 消 息 。 这 蕴含 
着 , c= true，、 因 此 g 最 迟 一 旦 接 到 m， 就 取得 快照 。 因 此 ，g 所 记录 的 状态 发 生 在 m 的 接收 之 前 ， 
m 的 接收 是 一 个 后 照 事 件 。( 回 忆 一 下 ， 这 仅仅 影响 哪个 局 部 状态 被 记录 ， 与 何 时 记录 无 关 ; 
在 这 种 情况 下 ， 记 录 可 能 与 第 一 个 后 照 事 件 同 时 发 生 。) 口 

禁用 Chandy-Lamport 算 法 (图 10-4 所 示 的 算法 ) 利用 标记 消息 区 别 前 照 消息 和 后 照 消息 ， 
并 要 求 信道 是 fifo 的 。Lai-Yang 算 法 (图 10-5 所 示 的 算法 ) 把 它们 是 前 照 事件 还 是 后 照 事件 明 
AUS ERRA ET, AERA ANE (piggyback) 基本 消息 中 信息 的 能 力 。 
TaylorfTay89j 已 经 证 明 ， 如 果 信 道 不 是 fifo 并 且 不 能 使 用 撒 带 ， 快 照 问题 的 解决 方法 一 定 会 受 
到 限制 ， 即 ， 暂 时 挂 起 基本 计算 。 在 关于 通信 的 各 种 假设 下 ， 对 不 同 限制 类 型 的 分 类 和 对 必 
须 的 限制 的 特征 描述 ， 可 在 Critchlow 和 Tayior 的 文献 [CT90] 中 找到 。 


10.3 使 用 快照 算法 





10.3.1 计算 信道 状态 


到 目前 为 止 ， 假 设 每 个 进程 的 状态 包含 进程 的 通信 历史 ， 因 此 可 从 近邻 进程 的 状态 计算 
出 快照 中 信道 的 状态 。 然 而 ， 在 大 多 数 情况 下 ， 由 于 开销 太 大 ， 不 能 把 进程 发 送 和 接收 的 所 
有 消息 明确 地 存储 起 来 。 现 在 我 们 将 要 阐述 ， 如 何 更 有 效 地 构造 信道 状态 。 

1. 简化 有 关 信 息 
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取决 于 快照 的 目的 ， 可 以 只 存储 有 限 数量 的 关于 通信 历史 的 有 关 信息 就 足够 了 。 例 如 ， 
我 们 可 能 希望 构造 令 牌 -交换 算法 (如 Korach-Kutten-Moran 算 法 ) 的 快照 ， 确 定 有 多 少 令 牌 
遍历 仍 处 在 活动 状态 。 为 了 确定 每 个 信道 中 的 令 牌 数 ， 每 个 进程 存储 它 所 发 送 和 接收 的 令 牌 
数 就 是 够 了 。 作 为 第 二 个 例子 ， 构 造 快照 来 测试 是 否 计算 已 经 终止 (参见 第 8 章 )。 这 仅仅 需 
要 确定 信道 是 否 为 空 ， 只 需 对 消息 计数 ， 而 无 需 确切 地 存储 它们 。( 在 这 两 个 例子 中 ， 每 个 进 
程 所 记录 的 状态 也 可 以 限制 到 少量 有 关 信 息 上 上 ， 即 ， 驻 留 在 进程 中 的 令 牌 数 ， 或 者 进程 是 处 
在 活动 状态 还 是 被 动 状态 。) 

2. 明确 构造 信道 状态 

借助 以 下 引 理 ， 可 以 明确 地 构造 信道 状态 。 

引 理 10.9 在 可 行 的 快照 中 ， sent pgYCvd pa 等 于 P 在 前 照 事件 中 所 发 送 的 和 9 在 后 归 事件 中 
所 接收 的 消息 集 。 

证 明 。 一 方面 ， 易 于 证 明 ， 一 条 属于 senrrevwcevd"w 中 的 消息 关 ， 在 前 照 中 被 发 送 和 在 后 照 
中 被 接收 。 另 一 方面 ， 如 果 消 息 m 在 前 照 中 发 送 和 后 照 中 接收 ， 根 据 定义 ， 它 被 包括 在 senr'，。 
中 ,但 不 在 rcvd"; 中 ， 因 此 它 在 sent”,ovevd'po。 口 

通过 记录 所 有 在 后 照 事件 中 接收 的 前 照 消 息 ， 进 程 q 构 造 信道 pg 的 状态 。 由 于 所 有 这 些 消 
息 在 4 取得 它 的 快照 之 后 才 被 接收 ，4 在 记录 它 的 状态 之 后 才 开 始 记录 消息 ， 并 且 所 有 前 照 消 
息 到 达 之 后 ， 停 止 记录 。 

Chandy-Lamport 算 法 。 在 从 p 到 4 发 送 消息 <mkr> 之 前 ， 接 收 所 有 从 p 到 5 的 前 照 消息 ， 只 
有 前 照 消息 在 标记 消息 之 前 被 接收 。 在 这 种 情况 下， 信道 状态 的 构造 极其 简单 : 信道 pg 的 状 
态 是 消息 的 集合 ， 这 些 消息 在 记录 完 状态 后 ， 以 及 接收 p 的 <mkr> 消 息 之 前 被 9 接收 。Lai- 
Yang 算 法 。 如 果 信 道 不 是 fifo 的 ， 进 程 q 可 能 交 赫 地 接收 前 照 消息 和 后 照 消 息 。 后 照 消息 的 接 
收 并 不 蕴含 着 ， 所 有 前 照 消息 已 被 接收 。 因 此 、 尽 管 很 清楚 ，g 应 该 记录 哪些 消息 ( 即 ， 标 记 
为 false 的 消息 是 前 照 消息 )， 但 是 不 清楚 gq 何 时 构造 完整 的 信道 状态 ， 并 能 够 停止 记录 .。 

Mattern [Mat89c] 提 出 了 一 种 解决 这 个 问题 的 方法 ，p 可 以 计算 发 送 给 q 的 前 照 消息 的 总 数 ， 
并 把 这 个 数 通 知 给 q (REET PRA, REC RIE). HGH 
所 接 到 的 前 照 消息 的 数目 (包括 前 照 事件 中 接 到 的 消息 和 后 照 事件 中 接 到 的 消息 )， 当 接 到 足 
够 多 的 前 照 消息 上 时， 终止 信道 状态 的 构造 。 


10.3.2 快照 的 适时 性 





由 本 章 算法 所 构造 的 快照 被 保证 在 其 被 取得 的 计算 中 是 有 意义 的 。 除 此 之 外 ， 我 们 希望 


快照 是 最 近 的 ， 即 由 快照 得 到 的 信息 不 是 很 上 昌 。 由 于 需要 一 种 时 间 表示 方法 ， 能 够 表达 出 信 
息 新 近 的 程度 ， 因 此 我 们 将 快照 与 分 布 式 执行 中 出 现 的 配置 联系 起 来 。 在 一 次 执行 中 ， 所 计 
算 的 快照 “位 于 ”记录 开始 的 配置 和 记录 结束 的 配置 之 间 。 如 下 列 定理 所 表达 的 。 

定理 10.10 。 设 E 是 一 次 执 行 ，S* 是 这 次 执行 中 取得 的 可 行 快照 ，y* 是 芒 含 的 系统 配置 。 
设 % 是 这 样 一 个 配置 ， 其 中 第 一 个 进程 记录 它 的 状态 ， 设 多 是 这 样 一 个 配置 ， 其 中 最 后 一 个 进 
程 记 录 它 的 状态 。 

那么 ,和 ~ A+ Yoo 

证 明 。 我 们 强调 定理 10.5 证 明 中 使 用 的 论证 方法 。 通 过 首先 按照 它们 在 E 中 发 生 的 次 序 枚 
举 E 中 的 前 照 事件 ， 然 后 按照 它们 在 E 中 的 出 现 次 序 ， 枚 举 E 中 的 后 照 事件 ， 来 构造 事件 序列 
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这 个 枚 举 与 E 的 因果 序 一 致 ， 因 此 定义 了 一 次 执行 F。 

FF 按照 这 种 次 序 包 含 配 置 Yy,/、y* 和 Y.。 这 显示 了 所 需 的 结果 。F 包 含 Y;， 是 因为 E 中 之 前 的 
所 有 事件 都 是 前 照 事 件 ， 因 此 恰好 以 相同 次 序 从 这 些 事件 开始 。F 包 含 Yy.， 是 因为 执行 E 中 。 
之 前 的 事件 集合 包含 所 有 前 照 事 件 ， 因 此 f 由 这 些 事件 开始 (尽管 可 能 以 不 同 次 序 )}。 根 据 定 
2.21, FBE ye 口 


10.3.3 稳定 性 检测 


设 P 是 配置 的 稳定 性 质 ， 一 旦 执行 达到 了 使 P 成 立 的 配置 ，P 会 永远 成 立 。 稳 定性 质 包括 : 

(1) 终止 性 ”如 果 y 是 终止 配置 ， 且 y ~ 6 ， 那 么 ，y = 6， 因 此 6 是 终止 配置 。 所 以 ， 终 
止 配置 问题 (第 8 章 )， 可 通过 计算 快照 并 为 其 中 的 活动 进程 和 基本 消息 检查 此 快照 ， 加 以 解 
决 。 然 而 第 8 章 中 的 特殊 解决 方法 通常 更 有 效 。 

(2) 死 锁 ”如 果 在 配置 x/ 中， 因为 5 中 的 所 有 进程 等 待 5 中 的 其 他 进程 ， 使 得 进程 的 一 个 子 
集 $ 被 阻塞 ， 即 使 8 外 的 进程 状态 可 能 已 经 改变 ， 在 以 后 的 配置 中 这 种 阻塞 情况 同样 成 立 。 检 
测 死 锁 的 问题 在 10.4 节 中 讨论 。 

(3) 令 牌 丢失 ”考虑 在 进程 间 循 环 传递 令 牌 的 算法 。 进 程 可 能 消耗 令 牌 。 性 质 “ 至 多 有 k 
个 令 牌 ” 是 稳定 的 ， 因 为 令 牌 可 能 被 消耗 但 是 不 会 产生 。 

(4) 无 用 信息 ”在 面向 对 象 程序 设计 环境 中 ， 创 建 对 象 集合 ， 每 个 对 象 可 能 保持 对 其 他 
对 象 的 引用 。 如 果 按 照 引 用 ， 能 够 找到 一 条 从 某 个 指定 对 象 到 该 对 象 的 路 径 ， 则 称 该 对 象 

是 可 达 的 ， 和 否则 称 该 对 象 是 无 用 信息 。 引 用 可 以 被 增加 和 删除 。 但 是 对 无 用 信息 的 引用 不 

能 增加 。 因 此 ， 一 旦 一 个 对 象 变 成 无 用 信息 ， 它 将 永远 是 无 用 信息 。( 有 许多 关于 无 用 信息 
收集 问题 的 文献 ， 本 书 中 不 做 论述 。 感 兴趣 的 读者 可 以 参考 fTM93] 以 及 文章 中 的 参考 文 
Hke) 

为 了 在 P 变 为 真 时 ， 采取 适 当 的 行动 ， 可 以 通过 另外 一 个 算法 ,检测 P 的 真 值 ， 该 算法 用 
于 观察 计算 ， 并 且 一 旦 发 现 有 为 真 时 ， 则 触发 行动 。 

一 个 非常 通用 的 检测 机 制作 为 图 10-6 所 示 的 算法 给 出 。 算 法 要 求 对 于 快照 配置 ， 检 测 P 是 
否 成 立 。 但 是 通常 可 以 通过 一 个 相对 简单 的 分 布 式 过 程 做 到 这 一 点 。 检 测算 法 的 任务 是 观察 
分 布 式 计算 的 动态 行为 ， 而 这 个 过 程 只 对 静态 数据 进行 分 析 (过 程 的 发 生 ， 表 示 一 个 配置 )。 
Pholds 的 计算 既 可 通过 集中 式 ， 又 可 通过 分 布 式 方式 。 在 集中 式 计算 中 ， 每 个 进程 向 一 个 特 
定 进程 发 送 它 的 快照 状态 ， 这 个 特定 进程 构造 完整 配置 ， 并 计算 Pholdr。 在 分 布 式 计算 中 ， 
计算 是 由 所 有 进程 合作 进行 的 。 


var detect : boolean init false ; 


while not Pholds do 
begin compute a global snapshot y; 


compute Pholds := P(y*) 
end ; 
detect := true 





图 10-6 稳定 -性 质 -检测 算法 


图 10-6 所 示 的 算法 满足 安全 性 和 活动 性 ， 如 以 下 两 个 定理 所 表述 的 。 这 些 性 质 就 是 检测 
算法 中 所 要 求 的 性 质 。 假 设 图 10-6 所 示 的 算法 观察 产生 执行 E 的 分 布 式 算法 。 
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定理 10.11 (2AM) wRA10-6F T H Hik HtureBS EE detect, 而 系统 此 时 配置 为 6， 
那么 P(6) 成 立 。 

证 明 。 设 yx* 是 所 计算 的 最 后 快照 ，%. 是 E 中 的 配置 ， 最 后 局 部 快照 y* 取 自 该 配置 。 由 算法 ， 
P (y*) 成 立 。 由 定理 10.10，y* ~> %。 因 为 在 y* 完 成 之 后 ， 才 对 detect 赋 值 ，Y。 和 ~ ô PHY 
E., AAP) 成 立 。 口 

定理 10.12 (活动 性 ) 如 果 E 达 到 使 P 成 立 的 配置 ， 那么 图 10-6 所 示 的 算法 在 有 限时 间 内 ， 
H truelh R X E detect, 

证 明 。 假 设 6 是 E 的 满足 P 的 第 一 个 配置 。 设 y, 是 6 后 (或 者 等 于 它 ) 的 第 一 个 配置 ， 在 这 
个 配置 中 ， 图 10-6 所 示 的 算法 开始 计算 快照 。y* 是 计算 在 y% 中 开始 的 快照 。 由 于 6 ~ ypy y* 
成 并 ， 所 以 P(X) 成 立 。 这 一 轮 之 后 ， 检 测算 法 终止 。 口 

图 10-6 所 示 的 算法 可 用 于 解决 所 有 稳定 -检测 问题 ， 但 是 在 使 用 时 ， 注 意 以 下 几 点 : 

(1) 对 于 某 个 特定 性 质 P，P(y*) 的 (分布 式 ) 求 值 可 能 需要 相当 复杂 的 算法 。 这 是 针对 
死 锁 -检测 问题 的 某 些 模型 的 情况 ; 参见 10.4 节 ， 测 试 给 定 配置 中 死 锁 的 一 个 算法 。 

(2) 在 某 些 情况 下 ， 由 于 空间 限制 ， 方法 是 不 可 行 的 。 这 就 是 无 用 信息 收集 问题 的 情况 。 
存储 所 有 调用 和 快照 消息 会 使 算法 对 空间 的 要 求 增 加 两 倍 以 上 ， 代 价 太 大 。 

当 评 估 无 用 信息 的 谓词 时 ， 早 先 的 无 用 信息 收集 算法 挂 起 基本 计算 ， 这 种 方法 相当 基础 ， 
但 由 于 挂 起 基本 计算 感觉 是 不 可 接受 的 ， 这 种 方法 通常 遭 到 拒绝 。 更 多 最 新 算法 是 “不 工作 ”， 
而 不 是 对 与 某 个 配置 操作 。 这 些 算 法 与 基本 计算 协作 ， 而 且 不 属于 依赖 快照 计算 的 算法 。 参 
见 文献 [Tel91b， 第 5 章 ] 和 [TM93]。 

(3) 即使 在 某 些 情形 下 ， 其 中 基于 图 10-6 所 示 算 法 的 解决 方法 是 简单 和 有 效 的 ， 这 些 算 
法 也 不 可 能 是 最 简单 和 最 有 效 的 。 这 种 情况 出 现在 终止 -检测 问题 中 ， 在 第 8 章 中 提出 了 相当 
基本 的 解决 方法 。 

快照 可 被 用 于 对 系统 配置 的 单调 函数 (monotonic function) 求 值 。 称 函数 /是 单调 的 ， 
如 果 





y ~ = f(y)< f8) 


RU RRB, HH = f(y*) 求 值 ， 那 么 对 于 其 后 的 每 个 配置 68，f(6)>f* 成 立 。 分 [348 
布 式 离散 -事件 模拟 器 的 全 局 庶 拟 时 间 (global virtual time, GVT) 是 单调 函数 的 例子 (参见 
[Tel91b， 第 4 章 ] 或 者 [CBT97] ) 。 


10.4 应 用 : 死 锁 检测 


在 某 些 分 布 式 程序 中 ， 当 进程 等 待 来 自 其 他 进程 的 消息 时 ， 暂 时 被 阻塞 。 这 样 的 例子 包 
括 数据 库 系 统 中 的 事务 处 理 ， 以 及 竞争 几 种 资源 的 进程 等 。 如 果 出 现 死 锁 ， 而 且 得 不 到 恰当 
处 理 ， 就 会 严重 危及 分 布 式 系统 的 性 能 和 使 用 。 首 先 ， 死 锁 中 涉及 的 进程 将 永远 不 能 完成 它 
们 的 任务 ， 其 次 ， 这 些 进 程 所 占据 的 资源 也 不 能 为 其 他 进程 所 用 。 显 然 ， 在 分 布 式 系统 的 实 
现 中 , 恰当 地 处 理 死 锁 是 最 重要 的 。 


10.4.1 基本 计算 模型 和 问题 阐述 
考虑 执行 基本 计算 (basic computation) 的 进程 的 集合 P， 这 里 不 关心 它 的 目的 和 工作 方 








式 。 进 程 由 于 等 待 其 他 进程 的 消息 可 能 不 得 不 挂 起 它 的 局 部 计算 。 这 可 以 一 个 用 阻塞 的 状态 
代替 进程 的 活动 状态 来 模型 化 。 

当 进 程 p 变 成 阻塞 时 (图 10-7 所 示 的 算法 中 的 行为 B,)， 它 将 请 求 消息 发 给 用 Regs, 表 示 的 
进 称 集 。 为 了 再 次 变 成 活动 状态 《行为 E,)，p 必 须 接收 Regqs, 中 进程 的 准许 消息 ， 但 不 必 是 从 
全 部 进程 。Regsp 的 子 集 ， 就 是 那些 满足 谓词 Free, 的 子 集 其 中 来 自 Reqs, 的 准许 消息 足以 使 p 再 
次 成 为 活动 状态 。P 所 接收 的 请 求 (行为 R,) 存储 在 集合 Pend, 中 ， 当 Pp 自身 处 于 活动 状态 时 ， 
行为 G, 对 这 些 请 求 作 出 应 答 。 进 程 p 发 出 的 请 求 数 ， 附 在 每 次 请 求 和 准许 消息 的 后 面 ， 使 得 p 
可 以 抛弃 为 对 陈旧 消息 的 应 答 而 发 送 的 准许 消息 (参见 F,)。 


var state, : (active, blocked) init active ; 
: integer init 0 ; (* Request number *) 
: set of processes ; (* Request set *) 
: set of processes ; (* Received grants *) 
: set of requests init Ø;  (* Pending requests *) 
: predicate ; (* Freeing constraints *) 


: { state, = active } 
begin determine Regs, and Freep ; Up := Up +1; 
forall q € Regs, do send (req, Up) tog; 
Grant, := Ø ; state, := blocked 
end 


: { A message (req, v) arrives from q } 
begin receive (req, v) from q ; Pend, := Pend, U {(q, v)} end 


: { statep = active A (q, v) € Pend, } 
begin send (grant,v) to q ; Pendp := Pend, \ {(q, v)} end 


: { A message (grant, v) arrives from q } 
begin receive (grant, v} from q ; 
if state, = blocked and v = v, then 
begin Grant, := Grant, U {q} ; 
if Free,(Grant,) then state, := active 
end 





图 10-7 基本 算法 


我 们 用 几 个 例子 说 明 Free, 的 使 用 。 首 先 ， 如 果 p 需 要 应 答 所 有 请 求 消息 ，Free, 仅 对 Regqs， 
为 真 。 其 次 ， 如 果 一 条 准许 消息 对 于 p 是 足够 的 ， 那 么 对 于 每 一 非 空 集合 ，Free ,为 真 。 第 三 也 
是 最 后 ， 假 设 p 需 要 1000M- 字 节 自 由 存储 空间 ， 并 向 磁盘 4 (900M 字 节 自 由 存储 空间 )、8B 
(600M 字 节 自 由 存储 空间 )、C (300M 字 节 自 由 存储 空间 ) MD ( 100M 字 节 自由 存储 空间 ) 发 
出 请 求 ， 如 果 A 和 其 他 的 任何 磁盘 可 用 ,-p 能 继续 。 同 样 ， 如 果 B8、C 和 D 可 用 ，p 也 能 继续 。 这 
里 Free, (S) 可 被 表示 成 


(#S>2AAES) V (#5 > 3) 


每 次 p 受 到 阻塞 时 ， 谓 词 Free, 可 能 不 同 。 但 总 是 满足 以 下 两 个 假设 。 
Di. Free, (2) 为 假 ，Free (Reqs,) HH. 
D2. Free, (A) 和 A CBAS Free, (B). 
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按照 D1， 在 接 到 任何 准许 消息 之 前 ，p 不 会 变 成 活动 的 。 当 接 到 来 自 Reqs, 中 所 有 进程 的 
准许 消息 时 ，p 才 变 成 活动 的 。 按 照 D2， 如 果 p 收 到 多 于 最 小 准许 消息 集合 的 消息 ，p 仍 然 可 

根据 基本 算法 ， 我 们 现在 定义 死 锁 进程 或 者 死 锁 配 置 。 

定义 10.13 称 进程 p 在 配置 /中 是 活着 的 ， 如 果 存 在 由 Yy 可 达 的 配置 8， 在 这 个 配置 中 p 是 
活动 的 ， 如 果 它 不 是 活着 的 ， 则 进程 p 是 死 锁 的 。 

如 果 在 Y 中 ， 硝 在 死 锁 进 程 ， 则 称 配置 y 是 死 锁 配 置 。 

TA, ABHRA REHE. WREE FERM, En~ p, WAPEN FEZ. K 
系统 从 配置 y 带 到 配置 6 的 基本 计算 的 事件 序列 ， 称 为 基本 计算 从 ?到 6 的 一 个 连续 序列 。 

死 锁 检 而 问题 是 设计 一 个 控制 算法 ， 能 够 被 强加 于 基本 计算 之 上 ， 并 满足 以 下 二 个 要 求 。 

(1) 非 -干涉 性 控制 算法 不 会 影响 基本 计算 。 

(2) 活动 性 如 果 出 现 死 锁 ， 控 制 算法 可 以 检测 到 。 

(3) 安全 性 仅 当 存在 死 锁 时 ， 算 法 才 进行 死 锁 检测 。 

控制 算法 可 能 要 求 交 换 附 加 信息 ， 称 为 控制 消息 ， 活 动 进程 或 者 阻塞 进程 都 可 发 送 控制 
消息 。 除 了 报告 发 生死 锁 之 外 ， 通 常 还 要 求 控制 算法 识别 一 个 或 者 多 个 将 被 用 于 死 锁 解 除 的 
死 锁 进程 。 
10.4.2 全 局 -标记 算法 


本 节 中 ， 我 们 提出 一 个 称 为 全 局 -标记 (global-marking) 的 算法 ， 用 于 死 锁 检测 和 所 有 
死 锁 进程 的 识别 。 该 算法 不 断 计 算 一 个 快照 ， 并 将 算法 10-8 应 用 于 所 构造 的 快照 配置 。state"，， 
v'p» Reqs’,, Grant’,, Pend’,, Free’,#i (sent’,\rcvd’) 的 值 作为 常量 (由 快照 算法 计算 出 它 
们 的 值 )。 算 法 模拟 准许 消息 的 交换 和 来 自 y* 的 一 个 连续 序列 中 的 进程 的 释放 过 程 ， 以 确定 哪 
个 进程 是 活着 的 。 

变量 aliver 初 始 值 为 假 ， 但 当 p 检 测 出 它 在 快照 中 是 活着 的 ， 则 设 它 为 真 。 这 就 是 当 p 在 快 
照 中 处 于 活动 状态 的 情况 。 但 是 如 果 到 目前 为 止 所 接收 的 <grant，v*,> 和 <Alive> 消 息 集合 满 
足 Free*,， 同 样 设 alive, 为 真 。 变 量 GrRec, 包 含 快照 中 已 经 收 到 的 或 者 传输 中 的 准许 消息 〈 针 
对 当前 请 求 )、 以 及 p 所 收 到 的 <Alive> 消 息 组 成 的 集合 。 

定理 10.14 全 局 -标记 算法 终止 ， 并 且 一 旦 终止 ，alivey 为 真 ， 当 且 仅 当 p 在 V+ 中 是 活着 
证 明 。 进 程 p 至 多 将 alive, 设 为 1rue 一 次 (并 发 送 相关 的 <Alive> 消 息 )， 因 此 只 交换 有 限 多 
的 消息 。 

标记 算法 模拟 y* 中 基本 算法 的 一 种 可 能 的 连续 序列 ， 其 中 变 成 活动 的 进程 就 是 那些 设置 
alive 为 true， 但 准许 消息 是 <Alive> 消 息 的 进程 。 在 模拟 的 一 个 连续 序列 中 ， 当 进程 变 成 活动 
上 时， 就 立即 准许 所 有 挂 起 的 请 求 。 执 行 M, 的 进程 p 在 y* 中 是 活动 的 ， 或 者 由 于 接 到 y* 中 正在 传 
输 的 消息 就 变 成 活动 的 ， 因 此 进程 p 在 y* 中 是 活着 的 。 在 行为 P, 中 设置 alive, 为 true 的 进程 p， 
因为 接 到 连续 序列 所 发 送 的 准许 消息 ， 而 在 模拟 的 连续 序列 中 变 成 活动 的 。 这 也 草 含 着 进程 
在 关中 是 活着 的 。 因 此 当 标 记 算 法 终止 时 ， 所 有 alive = true 的 进程 p 在 y* 中 都 是 活着 的 。 

接 下 来 要 证 明 ， 如 果 进 程 p 在 y* 中 是 活着 的 ， 那 么 alive, 的 值 为 ture。 设 p 在 y* 中 是 活着 的 ， 
Afi, os fi.) 为 六 中 的 一 个 连续 序列 ， 该 连续 序列 导致 生成 一 个 其 中 的 p 处 于 活动 状态 的 
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配置 6。 按照 这 样 的 顺序 (Y> Yi» very yi) 调用 配置 序列 ， 其 中 = y*, y= 0. 


var alive : boolean init false, 
GrRec : set of P init Grant) U {q : (grant, vz) € sent}, \ revd3,} ; 


Mp: (* Start marking in active process *) 
{ alivep A (states = active V Freez (GrRec,)) } 
begin alive, := true ; 
forall q € Pend, U {q : (req, v) € (sent*, \ revd3,)} 
do send { Alive) to q 
end 


P,: (* Propagate marking in freed processes *) 
{ An (Alive) message arrives from q } 
begin receive ( Alive) from q ; GrRecp := GrRecp U {q} ; 
if not alivep and Free;, (GrRecp) then 
begin alive, := true ; 
forall q € Pend) U {q : (req, v) € (sent*, \ revdjy)} 
do send { Alive) to q 





图 10-8 全 局 -标记 算法 


352 我 们 对 i 用 归纳 法 证 明 ， 如 果 y 是 进程 q 为 活动 的 第 一 个 配置 (位 于 % 到 y)， 那么 在 标记 过 
程 中 ，alive, 值 设置 为 frue。 

情形 i = 0: 由 于 4 在 * 中 是 活动 的 ， 那么 行为 M, 是 可 应 用 的 ， 将 elive, 值 设置 为 true。 

情形 ; > 0: 进程 4 在 % 到 Y-, 中 受到 阻塞 ， 在 事件 /中 变 成 活动 的 。 显 然 ， Jj 是 对 消息 <grant， 
”9> 的 接收 ， 并 把 Grant 加 入 到 满足 Freev (G) 的 集合 G 中 。 我 们 证 明 ， 对 于 每 个 rE G，r 最 终 
被 包括 在 标记 算法 的 GrRec, 中 。 考 虑 两 种 情况 。 

(1) 在 六 中 ,消息 <grant，v*s> 在 从 r 到 gq 的 传输 中 。 在 这 种 情况 下 ， 在 初始 化 为 Grant*。U 
{r: <grant, v> E sent „rcvd n yht, r 已 经 被 包括 在 CrRec, 中 。 

(2) 在 事 合 # 至 /-, 中 ， 有 一 个 事件 发 送 了 消息 <grant，yw>。 在 这 种 情况 下 ， (qs v) € 
Pend, 或 者 消息 <req，ve> 在 配置 中 到 7 的 传输 中 ，r 在 配置 % 至 配置 ys 之 间 的 一 个 配置 中 是 活 
动 的 。 由 归纳 假设 ， 标 记 算法 将 alive, 的 值 设 为 true， - 当 这 种 情况 发 生 时 ，r 向 gq 发 送 <Alive> 消 
息 ， 接 到 消息 之 后 ，r © GrRec, 成 立 。 - 

如 果 在 初始 化 后 ，GrRecs 包 含 G， 则 M, 是 可 应 用 的 ， 并 设置 alives 值 为 true; 否则 ， 在 接 
到 完成 G 的 消息 <Alive> 后 ， 设 alive, 值 为 true。 

特别 地 ，alive, 被 设 为 frue。 口 

图 10-8 所 示 的 算法 的 终止 性 是 隐 含 的 ， 但 是 可 通过 使 用 终止 检测 算法 (第 8 章 ) 来 检测 。 
当 检 测 出 全 局 标记 算法 的 终止 性 时 ， 那 些 alive， = false 的 进程 p 在 x* 中 处 于 死 锁 状态 。 


10.4.3 受 限 模型 的 死 锁 检测 


本 节 中 所 用 的 基本 计算 模型 是 用 于 研究 死 锁 - 检 测 问 题 的 最 通用 模型 。 用 这 种 模型 检测 死 
锁 的 算法 并 不 是 很 多 。 
Brzezinski, Hélary 和 Raynal[BHR92] 提 出 了 一 种 算法 ， 该 算法 也 是 基于 模拟 基本 算法 的 
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着 的 进程 集 的 令 牌 。 保 持 所 有 信息 集中 于 令 牌 中 ， 便 于 进行 标记 的 终止 检测 。 当 令 牌 环行 一 
Al, 集合 还 未 改变 上 时， 检测 出 终止 。 

常常 在 与 进程 激活 有 关 的 更 严格 的 假设 下 研究 终止 检测 问题 ， 允 许 利 用 图 论 来 刻画 死 锁 
特性 。 在 Knapp 的 文章 [Kna87] 中 ， 综 述 了 几 种 模型 和 算法 。 有 两 种 最 常用 的 模型 ， 一 种 是 进 
程 必须 获得 请 求 集合 中 所 有 进程 的 准许 ， 才 能 变 成 活动 状态 (AND 模 型 )。 另 一 种 是 进程 只 需 
获得 请 求 集合 中 某 个 进程 的 准许 ， 才 能 变 成 活动 状态 (OR 模型 )。 

1. 资源 死 锁 : AND 模 型 

分 布 式 数 据 库 由 分 散在 许多 站 点 (计算 机 ) 上 的 文件 集合 组 成 。 数 据 库 管理 系统 允许 用 
户 访 问 这 些 数据 ， 或 者 只 读 取 数 据 ， 或 者 修改 数据 。 通 过 数据 库 事务 处 理 ， 以 结构 化 的 方式 
访问 数据 ， 事 务 处 理 通常 将 数据 定 址 在 不 同 点 上 。 由 于 数据 项 的 分 散 性 ， 在 不 同事 务 处 理 时 ， 
必须 特别 仔细 以 避免 由 不 同事 务 采 取 的 步骤 发 生 交 错 。 通 常 采 用 对 事务 所 操作 的 数据 项 加 镇 
的 方法 来 保证 数据 库 操作 的 正确 性 。 当 然 ， 如 果 所 要 求 的 数据 已 经 被 另 一 事务 加 锁 ， 则 事务 
必须 等 待 。 

为 了 变 成 活动 状态 ， 事 物 必须 获得 它 所 请 求 的 全 部 锁 。 即 Free, (G) = (G = Reqs,). 4 
进程 所 有 请 求 得 到 准许 后 ， 进 程 才 能 变 成 活动 状态 ， 这 种 死 锁 的 受 限 模型 称 作 是 AND 模 型 。 

可 以 证 明 ， 在 AND 模 型 中 ， 死 锁 与 等 待 图 (wait-for graph) 中 的 循环 等 价 。 等 价 图 是 这 
样 一 种 图 ， 如 果 进 积 p 受 到 阻塞 ， 带 边 pg 的 所 有 进程 要 等 待 9。 例 如 ，Chandy、Misra 和 
Haas[CMH83]、Menasce 和 Muntz[MM79] 以 及 Mitchell 和 Merritt[MM84] 提 出 了 检查 图 中 循环 
的 算法 。 

2. 通信 死 锁 : OR 模 型 

在 分 布 式 算法 中 ， 与 其 他 进程 合作 的 进程 可 能 进入 死 锁 状态 ， 在 这 种 状态 下 ， 惟 一 可 能 
的 事件 是 与 其 他 进程 的 通信 。 任 何 通信 事件 的 执行 都 会 使 得 进程 进入 另 一 种 状态 ， 从 这 个 状 
态 ， 进 程 可 能 继续 它 的 计算 。 因 此 要 变 成 活动 状态 ， 进 程 的 某 个 请 求 得 到 准许 就 足够 了 ， 即 ， 
对 于 Reqsr 的 每 个 非 空子 集 ，Freen 为 true。 某 个 请 求 得 到 准许 就 足够 使 得 进程 变 成 活动 状态 ， 
这 种 死 锁 的 受 限 模 型 称 为 OR 模型 。 

在 OR 模型 中 ， 死 锁 等 价 于 在 等 待 图 中 出 现 结 。 例 如 ，Chandy、Misra 和 Haas[CMH83] 以 
及 Natarajan[Nat86] 提 出 了 针对 这 种 模型 的 算法 。 


习题 

10.1 节 

10.1 将 p 的 局 部 快照 配置 作为 附加 的 内 部 事件 a,， 证 明 

S* 是 有 意义 的 > V, q: alla, 

10.3 节 

10.2 给 出 Lai-Yang 算 法 的 完整 描述 ， 包 括 快照 完成 和 信道 状态 构造 的 实施 机 制 。 

10.3 PrzlwytszkowskyR# 5 ik: 

“阅读 第 10 章 ， 提 高 了 我 对 第 8 章 算法 的 理解 。 在 Safra 算 法 (图 8-7 所 示 的 算法 ) 中 ， 例 如 ， 
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Pp 对 令 牌 的 处 理应 该 被 看 作 是 定义 p 的 快照 状态 。 在 所 构造 的 快照 中 ， 所 有 进程 是 被 动 的 ， 因 
为 令 牌 只 能 由 被 动 进程 处 理 。 因 此 Pholds 的 计算 只 要 求 一 次 检查 ， 以 确定 是 否 所 有 信道 为 空 ， 
因此 ， 令 牌 收集 消息 计数 的 和 。 
然而 ， 我 不 明白 ， 黑 白 颜色 的 作用 ， 以 及 如 何 保证 快照 是 有 意义 的 ”。 
355 你 能 够 帮助 教授 吗 ? 
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规则 结构 的 网 络 ， 如 贺 环 、 超 立方 体 ， 通常 在 它们 的 链 路 上 标 以 方向 ， 我 们 现在 讨论 一 
些 最 新 评价 这 种 标注 方法 好 处 的 研究 成 果 ， 称 之 为 方向 侦 听 (sense of direction), 或 简 记 为 
SoD 。 方 向 侦 昕 的 可 用 性 增强 了 模型 ， 使 得 处 理 器 之 间 的 通信 效率 更 高 ， 并 且 在 算法 中 利用 
可 以 网 络 拓扑 结构 的 性 质 。 

已 经 证 明 ， 方 向 债 听 可 以 降低 某 些 问题 的 复杂 度 ， 但 是 可 应 用 方向 倾听 的 问题 数量 非常 
少 。 确 实 ， 对 于 许多 问题 ， 如 果 充 分 利用 边 路 标号 ， 就 能 得 到 更 有 效 和 更 容易 的 算法 。 然 而 ， 
在 许多 非 平 凡 的 例子 中 ， 对 于 未 做 标号 的 例子 ， 即 使 有 好 的 下 界 ， 也 不 可 用 。 此 外 ， 在 未 标 
号 的 图 中 ， 存 在 令 人 惊奇 的 有 效 算法 。 

本 章 试图 按照 由 SantorofSan84] 开 始 的 科学 研究 ， 建 立 在 两 个 领域 支持 方向 侦 听 的 例子 : 
广播 和 选举 。 

我 们 给 出 几 类 具体 网 络 的 方向 侦 昕 定义， 并 且 表 明 对 于 环 网 络 如 果 弦 和 其 上 的 方向 侦 听 
可 用 ， 可 以 更 有 效 的 解决 环 上 的 选举 问题 ; 如 果 SoD 可 用 ， 可 以 用 线性 复杂 度 解决 超 立 方 体 
和 团 上 的 选举 问题 ， 但 是 没有 SoD， 利 用 随机 算法 也 可 达到 同样 的 复杂 度 。 同 时 讨论 了 在 无 
任何 已 知 条 件 的 网 络 上 ， 计 算 网 络 中 SoD 的 算法 。 

本 章 综 述 。11.1 节 介绍 了 一 些 基本 的 表示 方法 ， 以 及 本 章 后 面 要 讨论 的 一 些 问题 。11.1.1 
节 引 入 了 方向 侦 听 的 形式 定义 。11.1.2 节 说 明了 它 的 用 处 。11.1.3 节 描述 了 如 何 利用 一 致 方向 
侦 听 ， 有 效 地 广播 消息 。11.2 节 提出 了 具有 方向 侦 听 的 环 和 弦 环 上 的 选举 方法 ， 包 括 借 助 方 
向 侦 听 降低 团 上 选举 复杂 度 的 示例 。 

11.3 节 研究 超 立 方 体 上 方向 侦 听 的 优点 。 近 年 来 ， 人 们 已 经 知道 在 标号 超 立 方 体 上 存在 非 
常 有 效 的 算法 。 而 在 未 标号 的 超 立 方 体 上 ， 算 法 却 不 太 有 效 。 研 究 的 重点 放 在 证 明 相 匹配 的 
下 界 上 。 最 近 ， 人 们 提出 了 未 标号 超 立 方 体 上 的 更 有 效 的 算法 ， 这 个 算法 表明 ， 有 效 性 的 获 
得 是 拓扑 结构 的 固有 特性 ， 而 与 边 路 标号 无 关 。 

11.4 节 讨论 了 各 种 与 复杂 度 有 关 的 主题 ， 包 括 计 算 未 标号 的 网 络 上 的 方向 侦 听 的 算法 。 最 
后 以 讨论 和 一 些 需 继续 研究 的 问题 结束 本 章 (11.5 节 )。 


11.1 引言 和 定义 


和 往常 一 样 ， 我 们 用 有 AN 个 节点 、m 条 边 的 图 将 处 理 器 网 络 模型 化 。 每 个 处 理 器 的 边 都 被 
局 部 地 命名 ， 因 此 一 个 处 理 器 可 以 辨别 出 它 已 经 从 哪 一 条 边 接 到 信息 ， 并 且 能 够 选择 通过 哪 
一 条 边 来 发 送信 息 。 处 理 器 有 不 同 的 标识 ， 但 是 这 些 标识 是 不 能 解释 的 数字 ， 也 没有 拓扑 结 
构 的 意义 。 我 们 假设 了 一 个 异步 网 络 。 


11.1.1 方向 侦 听 的 定义 和 特性 


尽管 近年 来 方向 俩 听 引 起 相当 关注 ， 但 是 关于 它 的 概念 还 没有 统一 定义 。 文 献 [Tel94] 定 
义 了 几 个 例子 。 方 向 侦 听 的 类 别 可 在 [EMS89] 中 找到 。 
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1. FEM 

我 们 按照 群 论 方法 求解 问题 。 首 先 回 忆 群 论 的 一 些 概念 。 对 于 某 些 学 生 ， 由 于 不 熟悉 这 
个 理论 ， 有 些 定义 似乎 略 显 神秘 ， 但 是 在 可 能 的 地 方 ， 我 们 将 给 出 具体 结构 的 明确 例子 。 

可 交换 群 或 者 阿 贝尔 (abelian) 群 是 集合 G， 有 一 个 特殊 的 零 元 素 0， 和 一 个 二 元 算 子 +， 
满足 以 下 要 求 。 

(1) 闭 性 对 于 所 有 x, yEG, (x+y) EG. 

(2) BEM 对 于 所 有 XEG, 0+x=x+0=x。 

(3) 可 逆 性 对 于 所 有 x E G， 存 在 y EG， 满足 x+y=y+x=0。 

(4) 可 结合 性 对 于 所 有 x, y, ZEG, (x+y) t+z=x+ (y+z)。 

(5) 可 交换 性 对 于 所 有 x,， y, xX+y=y+xX。 

由 于 它 的 可 结合 性 ， 我 们 在 求 和 中 将 省 略 括号 。 用 -x 表示 x 的 逆 ， 如 果 s EZ, MBAs K 
示 s 个 x 的 和 。 

G 中 元 素 的 个 数 称 为 它 的 阶 (order)， 用 ord(G) 表示 。 在 方向 侦 听 的 应 用 中 ， 假 设 ord 
(G) 有 限 。 在 有 限 群 中 ， 对 于 每 个 *， 存 在 正 数 :， 满 足 k x = 0。 最 小 的 这 种 正 数 是 x 的 阶 。 
它 总 是 对 群 的 阶 进行 划分 。 

对 于 元 素 g,，…，8k ， 考 虑 能 表示 成 8 的 和 的 元 素 集合 : ` 


k 
soli Del 


这 个 集合 本 身 是 一 个 群 ， 称 为 由 g1 至 gi 生成 的 子 群 ， 用 < 8,，…，8k > 表示 。 对 y E G， 集 
AT=S+y={y +x: xE5} 被 称 为 5 的 轨迹 (orbit) 或 者 g1 到 gi 的 轨迹 。5S 的 所 有 轨迹 大 小 相 
等 ,轨迹 $ + y FS + 岂 要 么 相等 ， 要 么 不 相交 ， 因 此 $ 的 轨迹 划分 G。 

称 群 是 循环 的 〈cyclic) ， 如 果 它 由 一 个 元 素 生 成 ， 即 存在 一 个 元 素 8， 满 足 G =<g>。 和 成 
器 不 是 惟一 的 (除了 阶 为 2 的 群 的 情况 )。 但 是 我 们 通常 固定 生成 器 ,并 称 它 为 1。 用 i 潜 示 六 1， 
用 ZZ 表示 阶 为 的 循环 群 。 

因此 ，Z 简 单 的 表示 模 k 数 的 群 。 它 的 元 素 为 0 到 k-1 的 数 。 另 一 个 值得 特别 关注 的 群 是 群 
(Z) 4 它 的 元 素 是 长 为 4 的 向 量 ， 群 的 操作 是 逐 点 增加 (Mk). 

2. 网 络 和 标号 

设 G 表 示 可 交换 群 ， 对 于 近邻 bp 和 gq， 设 £,(q) 表示 在 p 处 链 路 pq 的 名 字 。 群 方向 侦 听 的 
概念 就 是 网 络 的 拓扑 结构 与 群 的 结构 相 匹 配 。 

定义 11.1 如 果 边 标号 是 G 中 的 元 素 ， 称 对 边 标 号 AAOM (基于 G)， 并 且 存 在 从 
节点 到 G 的 单 射 N， 满 足 对 于 所 有 近邻 bp 和 9q，A/,= /+ L,(q). 

SEAM MIC, RARE LOM, MASS RRC 的 证 据 标 号 ( witnessing 
labeling) 或 者 证 所 (witness)。 处 理 器 知道 链 路 标号 LC ， 但 是 证 据 节 点 标号 不 要 求 或 者 不 假 
设 为 处 理 器 所 知 。 且 证 据 节点 标号 不 是 方向 侦 听 的 一 部 分 。 容 易 证 明 [Tel95]， 证 据 节点 标号 
不 是 惟一 的 ， 任 何 给 定 的 证 据 节点 标号 都 可 以 通过 把 一 个 国定 元 素 y E G 添 加 到 每 个 标号 上 来 
修改 。 因 此 方向 侦 听 的 证 据 标 号 数 恰 好 为 ord( G )。 

无 需 参考 对 节点 的 标号 ， 也 能 描述 方向 侦 听 的 特点 ， 即 ， 用 封闭 路 径 性 质 进行 刻画 ， 参 
见习 题 11.1。 

观察 可 见 ，SoD 并 不 把 标号 0 作为 边 的 标号 (因为 近邻 节点 标号 不 同 )， 并 且 SoD 满 足 反 对 


w 
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称 (anti-symmetry) 性 质 L,(q)+ Ls(p) =0, RRF. Lla) =- Ls(p)。 通常 ， 群 的 阶 等 
于 节点 数 ， 因 此 证 据 标号 是 双 射 的 。 对 于 我 们 所 给 出 的 大 多 数 算法 ， 这 个 性 质 是 不 重要 的 。 
但 我 们 常常 隐 含 地 作出 这 个 假设 。 

给 定 N 个 处 理 器 的 网 络 和 阶 为 的 群 G， 可 以 很 容易 地 构造 方向 侦 听 。 如 果 先 用 G 中 的 不 同 
元 素 任意 对 节点 标号 ， 然 后 对 于 每 条 边 g4， 取 L,(9) AN Np 就 得 到 一 个 方向 侦 听 。 

对 于 某 些 任 务 ， 正 如 后 面 将 要 表明 的 那样 ， 加 上 标号 可 以 大 大 降低 复杂 度 。 但 是 大 多 数 
结果 是 非常 有 效 的 标号 都 满足 另外 一 个 性 质 : 一 致 性 。 

3. 一 致 性 

通常 并 行 计算 机 中 的 处 理 器 结构 是 对 称 且 已 知 的 ( 即 ， 从 所 有 处 理 器 来 看 ， 图 看 起 来 
是 一 样 的 " )。 对 称 性 和 拓扑 结构 知识 隐 含 在 一 致 方向 侦 听 中 。 

定义 11.2 ”如 果 每 个 处 理 器 具有 相同 的 局 部 标号 集 ， 那 么 方向 俩 听 是 一 致 的 。 

设 L 是 链 路 标号 的 公共 集合 ， 直 接 可 得 一 致 方向 侦 听 的 一 些 性 质 。 

(1) 如 果 g ELL， 那么 -g EL: 标号 为 8 的 链 路 在 另 一 端的 标号 为 -8。 

(2) L 生 成 G， 因 为 对 于 每 个 s E G， 有 满足 SUM.(P) = 8 的 路 径 P 存 在 。 

(3) 对 于 g E G， 由 钱币 兑换 问题 的 一 般 情 况 ， 就 可 局 部 地 计算 出 福 足 SUMLP) = g 的 一 
条 最 短路 径 P。 并 可 计算 出 L 中 和 Hg 的 最 小 标号 序列 ， 且 因为 每 个 处 理 器 都 有 这 些 标 号 ， 这 个 
序列 定义 了 网 络 中 的 一 条 路 径 。 

我 们 用 一 个 处 理 器 上 的 标号 集合 描述 具有 一 致 方向 俩 听 的 网 络 ， 常常 省 略 相 反 情况 。 

4. 例子 

文献 中 所 找到 的 方向 债 听 的 例子 ， 其 中 大 多 数 是 我 们 所 做 定义 的 实例 。Flocchini 等 人 
[FMS98] 把 蓄 (chordal) 方向 侦 听 定义 为 Zw 上 的 方向 侦 听 。 特 别 令 人 感 兴趣 的 是 一 致 弦 SoD， 
其 中 1 (或 者 任何 其 他 生成 器 ) FER SH. AVN ANE (chordal ring) 就 像 环 ， 但 在 每 个 
节点 上 ， 另 有 一 个 “ 短 割 ”指向 环 中 一 定 步 数 之 外 的 节点 。 

定义 11.3 ZRC (ci, =, a) 是 一 个 网 络 。 对 于 这 个 网 络 ， 存 在 一 致 弦 方 向 侦 听 ， 且 

L={-ey, +, ey, -1, 1, cy, 0, Ck}; 


3k BkAR Hy 3X BM (number of chords), 

要 求 群 的 生成 器 作为 标号 出 现 是 至 关 紧 要 的 。 例 如 ， 对 于 有 环绕 且 k、 ! 互 质 的 kx IAR, 
它 具 有 一 致 的 落 方向 侦 听 ， 但 不 是 一 个 弦 环 。 在 群 的 框架 下 ， 我 们 现在 重新 定义 一 些 已 知 的 
拓扑 结构 。 


定义 11.4 ”一 个 上 xm 的 国 环 是 一 个 网 络 ， 对 于 这 个 网 络 ， 存 在 〈Z,)? 上 的 一 致 SoD， 且 


L={ (0, 1), (0, -1), (1, 0), (-1, 0) }。( 这 些 标 号 方便 地 称 为 N，S，E，W.) 
定义 11.5 一 个 n- 维 的 超 立 方 体 是 一 个 网 络 ， 对 于 这 个 网 络 ， 存 在 基 为 (Z,) "的 一 致 SoD， 
且 对 于 i=0,，…，n-1， 用 i= (0，…，1，…，0) 表示 n 个 标号 。 


定义 11.6 一 个 团 是 一 个 网 络 ， 对 于 这 个 网 络 ， 存 在 基 为 Zw 的 一 致 SoD， 且 L = Zn\ {0}, 
11.1.2 利用 方向 侦 听 


我 们 现在 给 出 几 种 关键 技术 ， 这 些 技术 作为 利用 方向 侦 听 的 基础 。 在 本 章 的 最 后 ， 将 会 
给 出 完整 的 算法 ， 用 以 说 明和 阐述 这 些 技术 。 
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1. 路 径 比 较 

给 定 两 条 路 径 ri 和 7， 起 点 相同 。 从 路 径 上 的 标号 可 以 判定 ， 是 否 它们 结束 于 同一 点 。 实 
际 上 ， 所 有 我 们 需要 做 的 就 是 ， 把 路 径 上 的 标号 加 起 来 ， 当 且 仅 当 标 号 之 和 相等 ， 路 径 的 终 
点 相同 。 

这 给 了 方向 侦 听 一 个 等 于 近邻 知识 的 优点 ， 并 且 如 6.4.3 小 节 ， 可 进行 深度 优先 搜索 遍历 ， 
消息 复杂 度 为 O(N)。 要 使 用 这 项 技术 ， 方 向 侦 听 无 需 是 一 致 的 。 

路 径 比较 的 可 能 性 对 于 方向 侦 听 是 如 此 基本 ， 以 至 于 Flocchini 等 人 [FMS98] 曾 提议 把 它 作 
为 方向 侦 昕 的 定义 。 在 他 们 的 方法 中 ， 恰 当 的 标号 伴随 着 明确 的 平移 函数 ， 该 函数 用 来 计算 
一 条 路 径 上 终点 的 相对 位 置 。 一 方面 ， 这 个 定义 更 具 一 般 性 ， 因 为 它 描述 了 更 大 一 类 标号 。 
然而 ， 它 的 优点 是 有 限 的 ,更 大 一 类 的 标号 包括 了 近邻 知识 (在 我 们 的 定义 中 ， 这 并 不 是 方 
向 债 听 的 例子 )， 以 及 一 些 在 分 布 式 算法 的 设计 中 几乎 不 用 的 标号 。 另 一 方面 ， 群 组 方法 获得 
了 简明 的 平移 函数 (如 ， 群 元 素 的 相 加 )， 因 此 使 得 人 们 可 以 更 专注 于 方向 侦 听 的 更 高 一 级 使 
用 上 。 

2. 路 径 压 缩 

如 果 方 向 俩 听 是 一 致 的 ， 它 也 列 含 着 网 络 拓扑 结构 的 完整 知识 。 实 际 上， 在 这 种 情况 下 ， 
考虑 方向 债 听 的 可 用 性 不 能 独立 于 对 拓扑 结构 的 全 面 了 解 。 利 用 前 面 提 到 的 通用 钱币 交换 问 
题 ， 一 致 方向 侦 听 可 使 到 达 网 络 中 相对 位 置 已 知 的 任 一 节点 的 路 由 更 有 效 。 

3. 网 络 结构 

一 致 方向 俩 听 可 以 充分 利用 网 络 的 群 组 结构 ， 来 指导 算法 的 整个 进程 。 我 们 以 广播 算法 
以 及 超 立方 体 上 的 选举 算法 〈11.3.2 小 节 ) 为 例 加 以 说 明 (图 11-2 所 示 算 法 )。 


11.1.3 具有 方向 侦 听 的 广播 


因为 我 们 的 主要 目标 之 一 是 比较 具有 方向 侦 听 和 没有 方向 侦 听 时 广播 算法 的 复杂 度 。 现 
在 将 要 证 明 ， 方 向 侦 昕 可 以 使 广播 算法 的 消息 复杂 度 为 O(N)。 如 果 没 有 拓扑 信息 可 用 ， 广 播 
要 求 至 少 通过 每 个 信道 交换 一 条 消息 (定理 6.6)， 因 此 消息 复杂 度 为 Q(1E1)。 

1. 利用 方向 侦 昕 进行 深度 优先 搜索 

Mans 和 Santoro 观 察 到 ， 利 用 近邻 知识 的 深度 优先 搜索 算法 《6.4.3 小节) 可 以 很 容易 地 推 
广 到 具有 方向 侦 昕 的 网 络 上。 回忆 一 下 图 6-18 所 示 算法 ， 它 循环 传递 令 牌 ， 令 牌 中 包含 已 访 
问 的 处 理 器 的 名 单 。 可 以 完全 避免 通过 后 向 边 发 送 令 牌 ， 因 为 转发 令 牌 的 处 理 器 会 检查 这 张 
表 ， 以 确定 是 否 近邻 名 字 就 在 令 牌 中 的 这 张 表 里 。 

图 11-1 所 示 算 法 表明 了 如 何 利用 方向 侦 听 ， 而 不 是 近邻 知识 进行 深度 优先 搜索 。 在 令 牌 
中 循环 的 这 张 表 不 再 包括 处 理 器 名 (并 不 假设 这 些 处 理 器 名 是 可 用 的 )， 但 却 标明 了 相对 于 消 
息 持 有 者 的 处 理 器 的 位 置 。 算 法 利用 了 “路 径 比 较 ” 能 力 : 处 理 器 9 将 自身 加 入 列表 ， 并 总 是 
将 数 0 插入 列表 。 在 标号 和 为 o 的 路 径 rY 上 将 这 张 表 转发 给 处 理 器 p 后 ,:0 已 经 被 恋 成 -o。 此 
KH, £Lo(p)=0, 且 Co(9g)=-a。 因 此 在 表 中 可 以 找到 边 pg 上 的 标号 。 

节点 一 旦 收 到 这 张 列 表 ， 则 将 接收 消息 所 经 过 的 链 路 标号 相 加 ， 完 成 相对 位 置 的 更 新 。 
这 是 对 图 6-18 所 示 的 算法 惟一 所 作 的 增加 。 

这 个 算法 不 仅 可 用 于 广播 算法 ， 而 且 可 用 于 Kutten 等 人 (7.4 节 ) 提出 的 选举 算法 。 其 中 
所 产生 的 算法 的 消息 复杂 度 为 O(N log W)。 结 果 ， 我 们 得 到 了 第 一 个 方向 侦 听 的 成 功 算法 。 
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因为 对 于 没有 SoD 的 广播 和 选举 ， 我 们 已 有 好 的 下 界 (定理 6.6 和 定理 7.15)。 我 们 强调 方向 侦 
上 昕 不 必 是 一 致 的 ， 因 此 利用 路 径 比较 能 力 足以 获得 这 个 结果 。 o 

推论 11.7 ARA AAA P, THORHOT ARRAS ARAO m) 
下 降 到 日 (N)， 选 举 算 法 的 复杂 度 从 B(N log N+m) 降低 到 B(Nlog N). 














var father, : process init udef ; 


For the initiator only, execute once: 
begin father, := p ; choose q € Neigh, ; 
send (tlist, {0}) to q 
en 





For each process, upon receipt of (tlist, L} through link A: 
begin forall z € L do x:=x+); 
. if father, = udef then father, : =A; 
if 3q € Neigh, \L 
then begin choose q € Neigh, \ L ; 
send (tlist, L U {0}) to q 
end 
else if p is initiator 
then decide 
else send (tlist, L U {0}) to father, 






end 






图 11-1 具有 SoD 的 深度 优先 搜索 算法 


2. 一 致 SoD 的 结构 算法 

一 致 方向 侦 听 可 使 处 理 器 决定 处 于 “就 绪 ” 状 态 的 网 络 的 一 棵 生成 树 ， 并 且 通 过 这 棵 生 
成 树 发 送 广播 消息 ， 只 用 N-1 条 消息 就 实现 广播 。 这 个 数 是 最 优 的 ， 因 为 与 广播 的 初始 进程 
不 同 的 N-1 个 处 理 器 ， 其 中 的 每 一 个 必须 通过 接收 一 条 消息 获悉 信息 。 

我 们 首先 给 出 关于 该 算法 的 一 个 基本 例子 : 假设 网 络 为 n x n 的 圆 环 ， 其 中 边 被 标号 为 
North、East 等 。 广 播 如 下 进行 。 初 始 处 理 器 先 把 消息 发 向 East， 然 后 消息 在 东 的 方向 被 转发 
n 一 1 个 跳 数 。 随后 从 West 方 向 接收 消息 的 初始 处 理 器 和 每 个 节点 向 North 方 向 转发 消息 ， 消息 
在 那个 方向 只 进行 ~-1 步 传播 。 

显而易见 ， 这 种 策略 可 行 ， 且 只 利用 N-1 条 消息 。 通 过 增加 另外 N-1 条 确认 消息 ， 算 法 实 
现 了 具有 反馈 (PIF) 机 制 的 广播 。 假 如 我 们 进一步 把 消息 向 East 方向 转发 一 步 ， 初 始 进程 就 
会 是 下 一 个 接收 者 ， 这 一 步 是 多 余 的 。 假 如 消息 被 进一步 向 North 方 向 转发 一 步 ， 就 会 被 初始 
时 间 North 方 向 发 送 它 的 处 理 器 接 到 ， 这 一 步 也 是 多 余 的 。 

例子 表明 ， 一 致 方向 侦 昕 是 如 何 局 部 地 提供 关于 整个 网 络 结构 的 信息 。 这 个 信息 可 以 被 
算法 使 用 。 我 们 用 本 算法 更 一 般 的 形式 继续 讨论 。 其 中 基于 网 络 的 群 可 以 是 任意 的 。 可 以 按 
任意 次 序 调 用 标号 8 到 &k ( 省略 相反 次 序 ) ,ni 到 nm 定义 如 下 。 首 先 ， 设 m1 为 81 的 阶 ; 接着 ， 设 
轴 为 8 在 G/<g1> 中 的 阶 ，ns 是 满足 n, - 8: 是 8 倍数 的 最 小 数 。 进 而 ， 设 n; 为 8: 在 G/<g1，…，gi-1> 
中 的 阶 ，n 为 使 8 表示 成 {81, … ,gin1} 中 元 素 和 的 最 小 数 。n; 具 有 以 下 性 质 : 它们 的 乘积 等 于 N， 
G 中 的 每 个 g 惟 一 地 记 为 


k 
a= Ys HO < s; <n, 


362 
363 
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图 11-2 所 示 的 算法 将 信息 沿 着 gj 方向 发 送 ， 经 过 nj-1 次 跳跃 。 为 所 有 与 初始 处 理 器 成 g, 倍 
数 的 处 理 器 提供 消息 。 接 到 -8 方向 消息 的 初始 处 理 器 和 所 有 处 理 器 向 g; 方 向 转发 该 消息 ， 经 
过 no.-1 次 跳跃 。 为 那些 与 初始 处 理 器 成 g1/ 加 8g; 倍数 的 处 理 器 提供 消息 。 总 之 ， 初 始 理 器 和 所 有 
处 理 器 从 方向 ~g; 到 -gi-, 接 到 消息 ， 并 沿 g; 方 向 转发 该 消息 ， 经 过 ni.1 次 跳跃 。 因 为 不 同 于 初始 
处 理 器 的 每 个 处 理 器 只 接收 一 次 消息 ， 因 此 图 11-2 所 示 的 算法 进行 N-1 次 消息 交换 。 

如 果 需 要 ， 加 上 N-1 次 反馈 消息 就 可 将 这 个 算法 变 成 PIF 算 法 。 

如 果 需 要 ， 非 -初始 处 理 器 也 能 存储 链 路 ， 通 过 这 条 链 路 ， 它 们 接收 消息 ， 来 建立 以 初始 
处 理 器 为 根 的 生成 树 。 这 棵 树 可 用 于 将 信息 发 送 回 初 始 处 理 器 的 信息 ， 参 见 11.3.2 小 节 。 算 法 
中 生成 树 的 深度 为 yw-D。 如 果 需 要 ， 这 个 深度 可 也 受到 这 样 一 个 次 序 的 影响 ， 按 照 这 
个 次 序 g1，...，g: 列 出 L 中 标号 。 在 此 将 不 进一步 讨论 这 个 问题 ( 它 与 广播 的 时 间 复 杂 度 有 
关 )。 

For the initiator: . 


fori=ltok 
do if n; > 1 then send (info, n; — 1) via link gi 


Upon receiving (info, s) via link —g;: 
if s > 1 then send (info, s — 1) via link g; ; 
fori=jt+ltok 
do if s; > 1 then send (info, s; 一 1) via link g; 





图 11-2 具有 一 致 方向 侦 听 的 广播 算法 


11.2 环 和 弦 环 的 选举 算法 


环 和 弦 环 上 的 选举 问题 有 很 长 的 历史 ， 参 见 7.2 节 。11.2.1 节 提出 了 Franklin 方 法 [Fra82] ， 
后 来 Attiya 等 人 [ALSZ89] 通 过 使 用 被 加 到 环 上 (一 致 地 ) 的 纺 ， 改 进 了 该 算 靶 。 他 们 的 算法 
利用 了 路 径 压 缩 技术 ， 并 且 只 要 少量 的 弦 就 可 达到 线性 复杂 度 ， 参 见 11.2.2 节 和 11.2.3 节 。 然 
而 ， 这 个 算法 只 利用 了 路 径 压 缩 技术 ， 而 没有 利用 网 络 结构 。 在 11.2.4 节 中 表明 ， 如 果 利用 了 
网 络 结构 ， 还 可 以 使 用 更 少 的 弦 ， 同 样 可 以 得 到 线性 算法 。 


11.2.1 Franklin 算 法 


Franklin 算 法 将 处 理 器 分 为 活动 处 理 器 和 转播 (relay) 处 理 器 ， 并 且 利用 一 连 串 的 轮 。 在 
第 一 轮 循环 之 前 ， 每 个 处 理 器 都 是 活动 的 。 开 始 轮 时 活动 处 理 器 数 多 于 一 个 ， 在 一 轮 循环 中 ， 
至 少 有 一 半 、 至 多 有 总 数 -1 个 处 理 器 要 变 成 转播 处 理 器 ， 接 着 进行 下 一 轮 。 只 有 一 个 活动 处 
理 器 开始 的 这 轮 ， 会 选择 这 个 处 理 器 ， 这 也 是 最 后 一 轮 。 因 此 ， 轮 次 数 至 多 为 [log N| +1， 因 
为 每 一 轮 只 有 2N 条 消息 ， 最 坏 情况 下 消息 复杂 度 大 约 是 2N log N. . 

在 每 一 轮 中 ， 活 动 处 理 器 与 左边 的 最 近 活动 处 理 器 和 右边 最 近 活动 处 理 器 交换 名 字 。 如 
业 一 个 处 理 器 是 它 自己 的 “最 近 活 动 处 理 器 *"， 则 它 就 是 慌 一 的 活动 处 理 器 ， 并 且 当选。 否则 
仅 当 它 的 名 字 大 于 它 的 左右 “活动 近邻 ”的 名 字 时 ， 它 在 该 轮 循环 中 存活 。 至 少 有 一 个 处 理 
器 《最 大 活动 处 理 器 ) 和 至 多 有 半数 处 理 器 (由 于 在 一 个 “生存 者 ”的 两 个 近邻 中 失败 ) 是 
为 真 的 条 件 。 具 有 较 大 最 近 活动 近邻 的 活动 处 理 器 变 成 转播 处 理 器 。 转 播 处 理 器 转发 它们 在 
相反 方向 所 接收 的 所 有 消息 。 这 一 点 在 图 11-3 中 没有 表明 。 
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state, := active ; 
while state, = active do 
begin send (name, p) to left ; send (name, p) to right ; 


receive (name, +) from right ; receive (name, y) from left ; 
if x =p and y = p then state, := elected ; 
if z > p or y > p then state, := relay 

end 





图 11-3 FRANKLIN 环 选举 算法 


11.2.2 Attiya 改 进 


在 Franklin 算 法 中 ， 活 动 进程 发 送 的 消息 数 是 线性 的 ， 图 11-4 所 示 的 算法 通过 转播 处 理 器 
消除 尽 可 能 多 的 消息 。 

随 着 每 轮 中 活动 处 理 器 数 减 半 ， 对 1gN 轮 中 的 活动 处 理 器 数 求 和 ， 其 值 限定 为 2V。 因 为 在 
一 轮 中 ， 一 个 活动 处 理 器 发 送 两 条 消息 ， 活 动 处 理 器 发 送 的 消息 数 是 线性 的 : 4N。 然 而 ， 消 
息 被 连续 转播 较 大 的 距离 ， 这 是 因为 在 第 ; 软 之 后 ， 连 续 的 活动 处 理 器 至 少 相隔 2: 个 位 置 。 总 
之 ， 由 被 动 处 理 器 转播 的 消息 几乎 占据 了 整个 消息 复杂 度 的 主要 部 分 。 

在 环 网 上 ， 这 是 不 可 避免 的 。 即 使 活动 处 理 器 知道 距 下 一 处 理 器 的 距离 ， 消 息 也 必须 通 
过 环 中 的 节点 转发 ， 因 为 这 是 最 短路 径 。Attiya 算 法 保留 了 Franklin 算 法 的 基本 控制 结构 ， 但 
是 保证 活动 处 理 器 知道 距 下 一 处 理 器 的 距离 ， 并 且 利用 弦 和 路 径 压 缩 来 快速 转发 消息 <name， 
p>。 弦 不 被 用 二 修改 算法 的 基本 竞争 结构 。 


statep := active ; Left, := —1 ; Righty := +1; 
while state, = active do 
begin Send((name, p), Left) ; Send(( name, p), Right) ; 
Receive(( name, z}, Right) ; Receive((name,y), Left) ; 
if p > x and p > y then 
begin Send({pos,0), Left) ; Send((pos,0), Right) ; 
Receive(( pos,r), Right) ; Right := Right +r ; 
Receive({pos,l), Left) ; Left := Left +1; 


if Left, = 0 then state, := elected 


end 
else 
begin (* relay the (pos, .) messages *) 
` Receive((pos,r), Right) ; Send({ pos, r + Right), Left) ; 
a Receive({ pos, l}, Left) ; Send((pos,!l + Left), Right) 
en 





图 11-4 ATTIYAR AEE 


我 们 现在 考虑 具有 方向 侦 听 的 弦 环 网 络 。 在 每 轮 的 一 开始 ， 一 个 活动 处 理 器 知道 它 左 边 
的 最 近 活 动 处 理 器 和 右边 最 近 活动 处 理 器 的 相对 位 置 ， 并 利用 续 发 送 它 的 名 字 。 假 设 用 通 
信 原 语 Send(message ，g) 和 Receive(message ，g) 实 现 路 径 压 缩 技术 。 第 一 个 原 语 经 过 SUM 。 
= 8 的 路 径 转 发 消息 ,第 二 条 原 语 接 收 这 个 消息 。 一 种 可 能 的 实现 是 仿 问 路 由 (greedy 
routing) 方法 ， 它 总 是 通过 不 超过 目的 处 理 器 的 最 大 弦 来 发 送 消息 。 参见 图 11-5 所 示 的 算法 。 
当然 ， 也 可 利用 更 复杂 的 算法 选择 边 ， 但 其 结果 ， 对 选举 算法 复杂 度 所 产生 的 影响 ， 微 乎 
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其 微 。 


procedure Send(m, g): 
begin if g= 0 
then deliver message m to waiting Receive 
else begin ch := the largest of g; s.t. ch < g; 
send (m, g — gi) through link ch 
end 
end 


Upon receipt of (m, g}: 
Send(m, g) 





图 11-5 贪 禁 路 由 策略 

初始 时 ， 左 右 活动 近邻 的 相对 位 置 分 别 为 -1 和 +1 。 在 一 轮 结束 时 ， 生 存 下 来 的 活动 处 理 
器 通过 在 该 轮 中 变 成 转播 的 一 连 串 的 处 理 器 ， 传 递 <pos，.> 消 息 ， 寻 找 最 近 活动 处 理 器 的 相 
对 位 置 。 如 果 在 某 一 轮 循环 结束 时 ， 只 有 一 个 处 理 器 存活 ， 则 处 理 器 发 现 它 是 自己 的 近邻 
(Left =0)， 于 是 找 出 领导 人 。 

新 算法 与 Franklin 算 法 的 不 同 之 处 在 于 ， 它 们 的 活动 处 理 器 的 通信 方式 不 同 。 对 于 活动 处 
理 器 数 所 经 过 的 次 数 求 和 , 仍 为 2N。 现在, 每 一 轮 中 ,活动 处 理 器 所 发 送 的 消息 数 是 4。 因 此 ， 
在 整个 算法 中 ，Send 操 作 的 数目 为 8N。 

我 们 首先 讨论 团 的 特例 。 这 种 情形 下 的 算法 最 早 由 Loui 等 人 提出 [LMW86]。 因 为 网 络 是 
完全 链接 的 ，Send 操 作 直接 路 由 消息 。 这 只 花费 一 次 消息 传递 ， 整 个 消息 复杂 度 为 8N。 这 是 
够 幸运 的 ， 因 为 Korach 等 人 [KMZ84] 已 经 给 出 了 没有 方向 侦 听 的 团 上 的 选举 算法 ， 其 消息 复 
杂 度 下 限 为 @Q(Nilog N). 

推论 11.8 ”在 一 个 图 上 ， 方 向 俩 听 的 可 用 性 使 得 选举 算法 的 复杂 度 从 B(N log N) 降低 到 
O(N). 

FRR, Attiyat K RA BRE (message cost function F) 定义 为 最 小 单调 凸 
AR, WTI BM, Send(m, 8) 要 求 至 多 交换 F(g) 条 消息 。 ( 非 形 式 地 ，F 表 示 向 相隔 跳 
数 为 8 的 一 个 处 理 器 发 送 一 条 消息 的 代价 . ) 在 最 坏 情况 下 ， 第 ; 轮 开始 时 ， 有 N/(2"1) 个 活动 
处 理 器 ， 相 隔 2"!' 个 跳 数 、 因 此 利用 Xx4xF(2") 条 消息 。 


引 理 11.9 图 11-4 所 示 的 算法 在 最 坏 情况 下 ， 利 用 an-z EOD 条 消息 。 

引 理 表明 ， 选 举 算法 的 整体 复杂 度 取决 于 环 上 发 送 消息 的 代价 。 作 为 特例 , K (Ele) g) 
上 的 消息 复杂 度 和 团 (F(g) = 1) 上 的 消息 复杂 度 分 别 为 O(N log N) 和 O(N)。Attiya 等 人 已 
经 证 明 ， 只 需 对 数 条 弦 ， 就 可 使 得 和 为 常数 。 例 如 在 弦 环 上 ，Cv (2，3，4，.…，Ig N)， 这 里 
不 再 重复 计算 。 


11.2.3 最 小 化 弦 数 


Attiya 算 法 确定 了 弦 环 上 的 选举 算法 复杂 度 为 线性 ， 现 在 我 们 把 注意 力 放 到 获得 该 复杂 度 
所 必需 的 最 小 弦 数 。 本 节 中 ， 我 们 利用 数学 公式 的 “向 后 图 工程 ”， 确定 为 Attiya 算 法 渐 近 地 
需要 的 弦 数 。 结 果 表 明了 算法 研究 的 一 种 趋势 : 就 是 变 得 越 来 越 不 “算法 化 "， 而 更 多 关注 分 
析 。 一 旦 处 理 了 选举 的 算法 方面 的 问题 ， 弦 和 复杂 度 的 关系 已 “封装 ”在 公式 中 ( 引 理 11.9)， 
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我 们 的 工作 集中 在 对 公式 的 处 理 方面 。 

1. 和 是 几何 级 数 jo) 

由 于 几何 级 数 (增长 率 小 于 1) WAAR, 首先 研究 多 少 条 蓄 才 能 使 一 一 的 界限 为 c， 其 
the <1, 


考 虚 弦 的 序列 L = {2，4，16，256，…}， 其 中 每 后 一 条 的 弱 是 前 一 条 弦 的 平方 ; 当下 一 
个 数 超过 N 时 ， 序 列 结束 。 弦 具有 22 的 形式 ， 因 此 ， 共 有 为 log log NRZ. 

引 理 11.10 F(d)< 2-Vd 。 

证 明 。 对 d 用 归纳 法 证 明 。 证 明 使 用 贪 末 路 由 。 和 为 d 的 路 径 从 与 4 相 匹配 的 最 大 弦 ! 开 始 ， 
在 长 为 4-! 的 路 径 上 继续 下 去 。 首 先 , F (1) = 1<2VI。 

现在 假设 d > 0 但 对 于 d' < d， 结 果 为 真 。 弦 的 构造 蕴含 着 ， 与 4 匹配 的 最 长 的 继 长 度 为 1， 
满足 Vd < 1< d， 可 得 , F (d) <1+F (4d-1) <14+2Jd-1<1+2Ja-Jd<2Jd. 

1 














wit, O 界限 为 2.{ - 方 )】 。 引 理 11.9 中 的 和 变 成 一 个 几何 级 数 ， 而 且 和 有 界 。 我 们 已 


经 证 明 ， 用 O(log log N) 条 弦 ， 进 行 线性 选举 是 可 能 的 。 由 此 可 得 ， 要 使 和 为 几何 级 数 ， 必 
FEMO (log log N) RE (如 果 使 用 贪 禁 路 由 )。 

引 理 11.11 如 果 存 在 常数 c < 1， 满 足利 用 贪 禁 路 由 Oce, MZ 3% %& HQ (log log N), 

证 明 。 对 于 每 个 i < log N, F(X) < ci. 2', KGS, BHRKBLYH (1c) Hex, 而 
ELEY AEBS SRS, RRB 2, A, MEN, EERE FRAT Ay i- 2 
内 的 弦 。 观 察 可 见 ， 如 果 P = i -( log 2)， 则 P 和 ;的 区 间 是 不 相交 的 。 因 此 ， 对 于 0e log 
(log N) 个 不 同 的 值 =(* log 27” (这 里 r< ("2 logClog N) )， 我 们 得 到 一 个 不 相交 区 间 的 
集合 [ (1/c)"... 2”]， 每 个 区 间 包 含 一 个 弦 长 。 

采用 其 他 的 路 由 策略 ， 不 会 对 结果 做 出 超过 一 个 常数 因子 的 改进 。 对 此 的 证 明 仍 然 是 一 
个 未 解决 的 问题 。 从 工 中 确定 与 钱币 交换 问题 有 关 ， 该 问题 要 求 使 用 给 定 的 由 不 同 币值 硬币 
组 成 的 集合 中 的 硬币 ， 来 支付 一 定数 额 。 在 钱币 交换 问题 中 ， 一 般 的 路 由 策略 意味 着 ， 人 允许 
利用 钱币 返回 。 

2. 更 慢 的 递减 求 和 

在 引 理 11.9 中 的 几何 级 数 给 出 了 线性 复杂 度 ， 但 却 要 求 86(log log N) 条 弦 才 能 实现 这 个 
结果 。 因 此 ， 我 们 可 以 选择 一 个 下 降 更 慢 的 序列 ， 但 是 这 个 序列 和 仍然 有 界 。 调 和 平方 级 数 Z 
(1/2) 就 是 所 选 序列 。 

假设 弦 长 集合 上 = (36, 64, 256, 65536, =}, Keg. = 2* 。36 是 该 公式 所 给 出 2 的 更 
大 次 器 的 最 小 数 。 由 于 g; = log? (gu), HFA, FE— RKI F log?d Fd ial tax. 

引 理 11.12 LP HERS F2 log* N, 

证 明 。 因 为 Bo 2 MIM >28 pee ga geo go EEES, 22, 2, 
22 ，… 增 长 更 快 ， 超 过 N 的 logxN 项 。 o 

为 了 在 短 距离 (d < 36) 上 有 效 地 进行 消息 路 由 ， 需 要 添加 一 些 短 弦 ， 但 这 仅 是 一 个 常数 。 


d 
F(d) < 2-——— 
引 理 11.13 F(d) < logd ° 
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证 明 。 对 于 较 大 d， 贪 禁 路 由 算法 首先 选择 弦 长 大 于 log2d 的 弦 !， 且 实现 
d-l d-log’ d d 
计算 表明 ， 要 获得 选举 问题 的 线性 复杂 度 ，B (1og* N) REBT. RBH SZ 
相 匹 配 的 纺 数 下 界 。 证 明 是 基于 求 和 过 程 ， 该 求 和 过 程 下 降 更 惕 ， 且 有 无 限 和 : 调和 级 数 
Z(1/i)。 这 个 序列 的 前 log n 项 的 总 和 为 G6(log log N)。 然 而 ， 要 达到 这 个 结果 ， 需 要 Q (log* N) 
RE. 
3111.14 采用 仿 甘 路 由 ， 如果 AD) < mi, 那么 至 少 存在 log* NR. 


TEA, AAPA PARE. FE, EPEN Fim‘ Ze. 口 

可 得 : 

(1) O(log* N) 条 弦 是 保证 调和 平方 级 数 收 敛 ( 引 理 11.3) 的 充分 条 件 。 

(2) Q(log* N) 条 弦 是 使 得 调和 级 数 ( 引 理 11.4) 发 散 的 必要 条 件 。 

为 了 得 到 线性 复杂 度 , 必须 对 引 理 11.9 中 的 和 加 以 限制 。 因 此 如 果 要 比 调 和 级 数 下 降 更 快 ， 
至 少 利用 Q (log* N) 条 弦 。 这 蕴含 着 ，6 (log* N) 条 弦 是 使 Attiya 算 法 具有 线性 复杂 度 的 充 
分 必要 条 件 。 


11.2.4 1- 弦 线性 算法 


本 小 刷 提 出 了 一 个 线性 弦 环 选举 算法 ， 该 算法 仅 需 一 条 弦 。 我 们 已 经 看 到 ， 这 在 Attiya 算 
法 中 是 不 可 能 的 。 因 为 在 Attiya 算 靶 中 ， 只 用 了 路 径 压 缩 方 法 ， 没 有 利用 网 络 拓扑 结构 。 

EREDAR AREA, AAT JN. RARE JN 的 弦 环 在 拓 
扑 结构 上 像 圆 环 。 我 们 的 算法 是 由 Peterson[Pet85] 的 圆 环 算法 改进 而 来 。 

当 新 一 轮 开始 时 ， 活 动 处 理 器 试图 寻找 同一 轮 中 的 另 一 个 活动 处 理 器 。 一 个 处 理 器 是 最 
多 可 看 见 一 个 其 他 处 理 器 ， 但 是 可 能 被 一 个 以 上 的 处 理 器 看 见 。 有 两 种 方式 可 使 活动 处 理 器 
被 提升 到 下 一 轮 循环 中 。 

第 一 种 方法 类 似 于 Franklin 算 法 中 的 “局 部 最 大 ”提升 : 如 果 处 理 器 看 见 一 个 更 小 的 处 
理 器 ， 并 且 也 被 一 个 更 小 的 处 理 器 看 见 ， 则 该 处 理 器 能 被 提升 。 按 照 这 个 规则 ， 至 多 有 一 半 
的 处 理 器 可 以 被 提升 。 因 为 如 果 一 个 处 理 器 被 提升 ， 至 少 一 个 看 见 它 的 较 小 处 理 器 将 不 能 被 
提升 。 

每 个 活动 处 理 器 搜索 网 络 ， 直 到 找到 另 一 个 活动 处 理 器 ， 代 价 太 大 。 因 此 ， 活 动 处 理 器 
只 搜索 网 络 的 一 个 受 限 的 子 网 络 ， 没 有 找到 其 他 的 活动 处 理 器 ， 搜 索 可 能 终止 。 在 这 种 情况 
下 ,第 二 种 提升 规则 疮 明 ， 正 在 搜索 的 处 理 器 被 提升 到 下 一 轮 循环 中 ! 

算法 的 关键 成 就 在 于 以 这 样 一 种 方法 设计 搜索 的 过 程 。(1) 搜索 区 域 足够 大 ， 以 至 于 按 
照 第 二 个 规则 ， 只 有 几 个 处 理 器 被 提升 ; (2) 搜索 区 域 足够 有 效 ， 可 得 到 较 好 的 整体 复杂 度 。 
现在 想象 一 下 在 一 个 无 限 的 网 格 上 画 一 个 越 来 越 大 的 方形 ， 可 以 观察 到 在 边界 上 的 点 数 要 比 
内 部 的 点 数 增长 更 慢 。 

1. 方形 和 边界 ， 搜 索 过 程 

对 于 g E Zy, 定义 8 的 /- 方 形 为 集合 S,, = {8 +i] +j:t: Oil, O<j<Q. Sp Æ Mt 
交叉 至 多 ! 条 1- 边 和 至 多 ! 条 r 边 ， 由 8 可 达 的 〈 至 多 ) (1+ 1) ?个 处 理 器 组 成 的 集合 。 一 个 活动 


F(d)=1+F(d-1) < 1+2: o 
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处 理 器 在 /- 方 形 内 搜索 其 他 活动 处 理 器 ， 但 是 并 不 向 方形 内 的 所 有 处 理 器 发 送 消息 ， 因 为 代价 
太 大 。 

SLi. RK (boundary) Bs 为 点 的 集合 ， 其 中 至 少 有 一 个 不 等 式 中 是 等 式 ， 即 ，B。 = {8 + 
i-l, gti l¢]-t, gti-t, gt] l+i-t: 0<igl}。 定 义 内 部 (internal) 点 的 集合 
ls = Sei \ Bs ° 边界 Bs, 包含 (至 多 ) 4! 个 处 理 器 。 QRS,» 和 Su 相交 ， IAB, MB, 相交 。 
图 11-6， 以 弦 长 为 8 的 弦 环 为 例 说 明 3- 方 形 。 





一 * 一 /3 内 部 点 
一 一 $43 外 部 点 


图 11-6 方形 和 边界 


在 第 ; 轮 中 的 处 理 器 ， 通 过 沿 着 六方 形 的 边界 ， 发 送 一 个 搜索 令 牌 ， 开 始 寻找 另外 的 处 理 
器 。 令 牌 试图 沿 方向 1 行进 ! 步 ， 沿 方向 ! 行 进 / 步 ， 沿 方向 -1 行进 ! 步 ， 沿 方向 -1 行进 !/ 步 。 方 形 
PK RM THR. TERI, KR = a (其 中 o 是 比 1 稍 大 的 常数 )。 遍 历 整 个 边界 
需要 花费 4! 条 消息 ， 但 是 有 几 个 原因 可 以 中 断 这 个 遍历 。 

如 果 p 的 令 牌 进入 一 个 已 被 一 个 具有 更 大 轮 数 的 令 牌 访问 过 的 处 理 器 ， 就 中 止 遍历 ，p 就 
永远 不 能 接 到 搜索 令 牌 的 返回 消息 ， 也 就 永远 不 能 进入 下 一 轮 。 如 果 p 的 令 牌 第 一 次 进入 一 个 
已 被 同一 轮 循环 的 不 同 令 牌 (如 ，gq) 访问 过 的 处 理 器 ，p“ 看 见 ”q。 如 果 g 小 于 p， 处 理 器 p 
必须 变 成 已 知 。 因 为 看 见 q 对 于 p 是 至 关 重 要 的 ， 因 为 按照 规则 1 ， 它 可 以 被 提升 。 如 果 g 大 于 p， 
Pp 就 失去 了 被 提升 的 机 会 ， 但 是 因为 被 p 看 见 对 于 g 按 照 规 则 1 被 提升 是 至 关 重 要 的 ， 因 此 gq 必须 
被 告知 。 因 此 或 者 令 牌 返回 p>， 或 者 通过 gq 的 令 牌 所 遍历 的 边界 ， 将 追逐 令 牌 发 送 到 g 以 通知 g 
它 已 被 更 小 处 理 器 看 见 。 现 在 ， 当 4 被 告知 ， 一 个 更 小 的 处 理 器 看 到 了 它 时 ， 已 经 转发 追逐 令 
牌 给 4 的 处 理 器 将 不 再 转发 的 追逐 令 牌 。 

描述 令 牌 处 理 的 过 程 ， 蕴 含 着 如 下 提升 p 到 下 一 轮 的 局 部 条 件 。 首 先 ，p 的 搜索 令 牌 返回 
时 ， 已 经 看 到 一 个 较 小 处 理 器 ， 并 且 追 逐 令 牌 到 达 ， 报 告 p 被 一 个 较 小 的 处 理 器 看 见 。 其 次 ， 
2 的 搜索 令 牌 返回 ， 没 有 看 见 另 一 个 处 理 器 。 

我 们 要 证 明 ， 每 一 轮 中 至 少 提升 一 个 处 理 器 。 如 果 没 有 处 理 器 看 见 另 一 个 处 理 器 ， 所 有 
处 理 器 都 被 提升 。 如 果 至 少 有 一 个 处 理 器 看 见 另 一 个 处 理 器 ， 设 r 是 被 看 见 的 最 大 处 理 器 。 或 
者 r 没 看 见 处 理 器 ， 按 照 第 二 个 规则 ， 它 被 提升 ， 或 者 看 见 一 个 较 小 的 处 理 器 ， 按 照 第 一 个 规 
则 ， 它 也 被 提升 。 

2. 一 些 计算 

我 们 的 算法 非常 近似 于 Peterson 的 算法 [Pet85]， 并 且 计算 也 相同 。 设 4 是 第 ; 轮 开始 时 的 活 
动 处 理 器 数 ， 则 有 A。< N。 我 们 首先 对 于 所 有 轮 中 活动 处 理 器 数 4; 进行 限制 ， 方 形 大 小 <N， 
即 ， 循 环 轮 数 "logVN 。 


引 理 11.15 对 于 所 有 轮 ， 如 果 i 《slogVN ， 则 有 A < 
a“(2-a’) 
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证 明 。 我 们 已 经 证 明 ， 每 个 按照 第 一 个 规则 被 提升 的 处 理 器 被 另 一 个 未 被 提升 的 处 理 器 
看 见 。 因 此 ， 最 多 一 半 的 看 见 另 一 个 处 理 器 的 处 理 器 ， 按 照 这 个 规则 被 提升。 

某 些 处 理 器 可 能 按照 第 二 个 规则 被 提升 (没有 看 到 另外 的 处 理 器 ) ， 但 是 如 果 p 和 9 都 按 此 
RUARI MSp 和 $2, 不 相交 。 如 果 方 形 重 熏 ，p 和 4 的 令 牌 遍历 的 边界 也 重 登 。 当 其 中 
的 一 个 令 牌 首先 到 达 交 叉 点 ， 使 得 另 一 个 令 牌 由 于 没有 看 到 另 一 个 处 理 器 而 不 可 能 完成 遍历 。 
因此 按照 这 个 规则 被 提升 的 处 理 器 数 少 于 MP:。 

由 上 所 述 及 以 前 的 选择 5 = of， 可 得 
A,+N/a™ 

2 

N 
利用 对 的 归纳 法 ， 可 以 验证 ， 上 式 蕴含 着 4 < a 。 
引 理 莉 含 消息 数 为 线性 界 ， 以 及 达到 轮 “log VN 时 ， 处 理 器 数 常数 。 
推论 11.16 在 第 0 轮 到 第 “logVN EHP, RRHH LESE — N 
(@=1)2-a") 


证 明 。 引 理 11.15 已 经 确定 了 第 ; 轮 中 活动 处 理 器 的 数目 。 消 息 计算 如 下 。 活 动 处 理 器 p 的 
搜索 可 以 进行 40i 步 ， 归 于 p。 向 p 路 由 的 追逐 令 牌 也 归于 p。 由 p 的 搜索 所 访问 的 每 个 处 理 器 至 
多 转发 一 次 追逐 令 牌 ,因此 至 多 4ai 个 追逐 步 归 于 p。 


N 
因此 在 第 i 轮 中 ， Qa 中 的 每 个 处 理 器 至 多 交换 8ai 条 消息 。 因 此 第 : 轮 中 的 
消息 总 数 界限 为 一 za UD. 对 轮 数 求 和 ， 得 到 


3. 算法 的 终 上 性 

MUSES ae, EB og VN 轮 中 ， 只 有 少 于 常数 ， 即 ，1/( 2-o2) 个 处 理 器 能 够 存活 
下 来 。 为 了 在 这 些 处 理 器 之 间 进 行 选举 ， 算 法 在 那 轮 之 后 继续 进行 第 二 步 ， 如 同 Chang- 
Robert 算 法 〈7.2.1 小 节 ) 对 其 进行 组 织 。 每 个 在 第 "log VN 轮 中 存活 下 来 的 处 理 器 沿 着 整个 环 
发 送 令 牌 ， 即 ， 在 +1 的 方向 进行 N 步 。 令 牌 可 被 具有 更 大 标识 且 在 那 轮 中 存活 下 来 的 令 牌 删 
除 ， 并 且 在 算法 的 第 一 步 中 ， 中 止 处 理 器 的 活动 。 在 第 二 步 中 ， 保 证 只 有 在 第 “log VN 轮 中 
存活 的 最 大 处 理 器 接收 它 的 返回 令 牌 ， 则 该 处 理 器 被 选中 。 

定理 11.17 具有 一 条 长 为 VN 的 弦 的 弦 环 上 算法 选举 一 个 领导 人 的 消息 复杂 度 为 OUN)， 

证 明 。 在 第 一 步 中 ， 没 有 一 轮 会 杀 死 所 有 活动 处 理 器 ， 至 少 有 一 个 处 理 器 存活 到 第 二 步 。 
第 二 步 保证 这 些 处 理 器 中 只 有 一 个 被 选 ， 这 就 确定 了 算法 的 正确 性 。 

由 推论 11.16 可 得 ， 第 一 步 利 用 O (N) 条 消息 ， 第 二 步 只 利用 O(N) 条 消息 ， 这 是 因为 在 
那 一 轮 中 ， 至 多 常数 个 处 理 器 初始 一 个 令 牌 。 口 


11.3 超 立 方 体 上 的 计算 


这 一 上告， 我 们 研究 是 否 方向 侦 听 会 减 小 在 超 立 体 方 体 上 广播 和 选举 的 复杂 度 。 答 案 是 肯 
定 的 ， 因 为 已 知 的 利用 方向 侦 听 的 算法 已 经 胜 过 无 标号 超 立方 体 上 的 已 知 的 最 好 算法 。 然 而 ， 
因为 对 于 未 标号 的 情形 ， 还 没有 相 匹 配 的 下 界 ， 因 此 还 没有 得 出 肯定 的 结论 。 

近年 来 ， 人 们 提出 了 未 标号 超 立 方 体 上 的 有 效 算法 。 弥 补 了 有 标号 和 无 标号 情形 下 已 知 
复杂 度 之 间 的 差距 。11.3.1 小 节 考 虑 的 是 没有 方向 侦 听 、 没 有 拓扑 结构 知识 的 网 络 。 即 ， 我 们 
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考虑 在 每 个 网 络 上 都 正确 的 算法 。 并 研究 它们 在 超 立方 体 上 的 复杂 度 。 在 11.3.2 节 ， 我 们 的 研 [874 
究 是 建立 在 假设 有 方向 侦 听 和 拓扑 结构 知识 的 网 络 上 ， 将 会 看 到 ， 那 里 存在 精致 、 简 单 、 有 
效 的 算法 。 

研究 的 难点 是 有 拓扑 结构 知识 而 没有 方向 侦 听 的 情形 。 即 ， 算 法 只 需 在 超 立 方 体 上 正确 
运行 ,但 对 有 意义 的 边 标 号 不 做 假设 。 可 以 证 明 ， 利 用 线性 消息 ， 就 能 进行 广播 。11.3.3 节 提 
出 超 立 方 体 上 的 定向 算法 ，11.3.4 节 引入 了 掩 码 技术 和 广播 算法 。11.3.5 节 讨论 了 对 于 无 标号 
的 超 立 方 体 ， 最 近 的 一 些 选举 算法 中 使 用 的 技术 。 我 们 没有 考虑 有 方向 侦 听 但 是 没有 拓扑 结 
构 知 识 的 情况 。 


11.3.1 基线 : 没有 拓扑 知识 


在 没有 拓扑 结构 知识 和 方向 侦 听 的 情况 下 ， 广 播 算 法 和 选举 算法 要 求 网 络 的 每 一 条 边 至 
少 携带 一 条 消息 。 事 实 上 ， 算 法 要 在 每 个 图 中 都 正确 运行 ， 这 一 点 允许 使 用 定理 6.6 和 定理 
7.15 中 的 “节点 插入 ”技术 。 因 此 ， 当 在 超 立 方 体 上 执行 时 ， 算 法 至 少 利 用 9(N log N) 条 消 
息 。 

另 一 方面 ， 通 过 扩散 式 路 由 或 者 回 波 算法 (图 6-5 所 示 的 算法 ) 也 可 进行 广播 。 利 用 
Gallager 等 人 的 算法 (图 7-10、 图 7-11 以 及 图 7-12 所 示 的 算法 ) 可 以 进行 选举 。 因 此 ， 两 个 任 
务 都 需要 O(N log N) 条 消息 。 

定理 11.18 在 没有 拓扑 结构 知识 的 超 立 方 体 上 进行 选举 和 广播 ， 消 息 复杂 度 为 B(Nlog N)。 


11.3.2 进行 比赛 的 算法 


在 具有 方向 侦 听 的 超 立 方 体 上 ， 进 行 比赛 的 选举 算法 使 用 超 立 方 体 图 的 递归 结构 。 为 了 
选 出 4+1 维 超 立 方 体 上 的 领导 人 ， 算 法 首先 在 几乎 是 最 后 一 个 生成 器 生成 的 4d 维 超 立方 体 的 每 
个 面 上 选 出 一 个 领导 人 ， 然 后 选 出 两 个 领导 人 中 的 一 个 。 为 了 避免 算法 的 不 同 阶段 所 产生 的 
领导 人 之 闻 相互 混淆 ， 如 果 它 赢得 一 个 d 维 面 上 的 选举 ， 我 们 称 一 个 节点 是 d- 领 导 人 。 

本 算法 的 基础 情况 是 在 第 0 维 面 上 的 选举 ， 这 很 简单 。 网 络 只 由 一 个 节点 组 成 ， 它 就 是 0- 
领导 人 。 

1. 锦标 赛 

成 为 4- 领 导 人 (对 于 d <n) 的 节点 与 在 方向 4 上 的 近邻 面 上 的 d- 领 导 人 进行 锦标 赛 。 如 果 两 
节点 能 直接 通信 ， 那 么 它们 之 间 的 比赛 是 容易 组 织 的 。 每 个 节点 向 另 一 节点 发 送 包 含 自己 名 字 
的 消息 ， 接 到 名 字 比 自己 的 大 的 节点 成 为 非 - 领 导 人 ， 接 到 名 字 比 自己 的 小 的 节点 成 为 领导 人 。 

按照 同样 的 方法 进行 两 个 4- 领 导 人 之 间 的 比赛 。 但 是 存在 这 样 的 困难 ， 就 是 节点 并 不 知 
道 如 何 到 达 另 一 个 面 上 《即使 它们 自己 的 面 ) 的 领导 人 。 作 为 第 一 步 ， 成 为 4- 领 导 人 的 节点 p 
通过 方向 4 上 的 边 发 送 一 条 比赛 消息 <tour，p，d>， 在 消息 中 包含 自己 的 名 字 和 步 数 4d。 这 条 
消息 被 另 一 个 d- 维 面 上 的 节点 接收 。 这 个 我 们 称 为 入 口 (entry) 节点 的 接收 节点 ， 其 职责 是 
转发 消息 给 它 的 d- 领 导 人 ， 参 见 图 11-7。 

把 消息 转发 给 d- 领 导 人 的 困难 是 ， 入 口 节点 并 不 知道 4- 领 导 人 的 相对 位 置 。 如 果 d- 领 导 
人 把 它 的 位 置 通 知 d- 立 方 体 上 的 所 有 节点 , 使 得 每 个 人 口 节点 都 能 以 d 步 转发 消息 ,代价 太 大 。 
这 种 通知 要 求 2~1 条 消息 ， 从 而 导致 选举 的 整个 复杂 度 为 O(N log N)。 类 似 地 ， 如 果 入 口 节 
点 通过 4d- 立 方 体 广播 锦标 赛 消息 ， 这 也 需要 2“-1 条 消息 ， 代 价 还 是 太 大 。 
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O a- 领导 人 


O anta 
一 > d 方 向 上 的 
消息 








机 转发 的 消息 








d- FD d-7 A 
图 11-7 锦标 赛 中 的 消息 转发 


我 们 的 解决 方法 使 用 了 这 两 个 基本 策略 的 组 合 。d- 领 导 人 向 在 Ld/2j- 维 的 面 上 的 所 有 节 


点 发 布 它 是 领导 人 的 消息 ， 称 |d/2j- 维 的 面 为 领导 人 的 行 。 和 人口 节点 通过 「d/21- 维 的 面 广 播 


锦标 赛 消息 ， 称 此 「d/21- 维 的 面 为 它 的 列 。 由 于 每 行 每 列 只 相交 一 点 (如 下 所 示 )， 存 在 一 
个 节点 ， 称 它 为 比赛 节点 (match node )。 它 既 接 收 来 自 4~ 领 导 人 发 布 的 消息 ， 也 接收 锦标 赛 
消息 。 比 赛 节 点 经 过 发 布 消息 所 产生 的 生成 树 ， 进 一 步 将 锦标 赛 消 息 转发 给 d- 领 导 人 。 
定义 11.19 考虑 d- 维 超 立 方 体 。 
一 行 是 关于 生成 器 0 到 [d/2|-1 的 一 个 面 。 
一 列 是 关于 生成 器 [d/2| 到 d-~1 的 一 个 面 。 
两 个 4d- 领导 人 之 间 的 锦标 赛 组 织 如 下 。 
(1) 一 个 d- 领 导 人 p 经 过 链 路 d 发 送 消 息 <tour，p，d>。 
(2) 一 个 4- 领 导 人 利用 图 11-2 所 示 的 算法 在 它 的 行 上 广播 它 的 领导 人 消息 。 行 中 的 节点 
将 接收 广播 消息 所 通过 的 链 路 存储 起 来 ， 并 计算 行 的 一 棵 生成 树 。( 广播 算法 采取 简单 的 形式 ， 
因为 生成 器 是 独立 的 ， 每 个 nn, 等 于 1。 跳 数 计数 器 可 以 查禁 。) 
(3) 一 个 人口 节点 ( 即 ， 经 过 链 路 d 接 收 <tour，p，d> 的 节点 ) 利用 图 11-2 所 示 的 算法 通 
过 它 的 列 广播 消息 。 
(4) 在 领导 人 所 在 行 中 ， 接 收 <tour，p，d> 消 息 的 非 -~d- 领 导 人 4g ( 即 ，q 已 经 接 到 <ann， 
d> 消 息 ) 把 消息 发 送 给 它 的 父 节点 。 
(5) 接收 到 <tour，P， 心 消息 的 人 -领导 人 4 与 p 进 行 比较 ， 如 果 g > p， 则 g 变 为 (d+1)- 领 
导 人 ， 否 则 g 变 成 非 - 领 导 人 。 
2. 通信 复杂 度 
设 T(d) 是 在 锦标 赛 中 两 个 d- 领 导 人 交换 的 消息 数 ，E(n) 是 选举 算法 (在 维 数 为 4 的 超 
WAKE) 中 所 使 用 的 消息 数 。 由 于 产生 一 次 选举 ， 要 求 两 个 在 较 小 的 立方 体 上 的 选举 和 一 
次 锦标 赛 ， 我 们 可 得 到 递归 方程 。 
如 果 n = 0 
E(n) = | E(n-1)+T(n-1) 否则 


在 分 析 消息 复杂 度 时 ， 我 们 需要 知道 无 穷 级 数 和 (a< D 以 及 关于 a 的 导出 结果 。 


Ja pga ow “二 -oy 


对 两 个 4- 领 导 人 之 间 的 锦标 赛 ， 计 算 其 中 每 一 步 交换 的 消息 数 。 可 得 





HUF BDORMASRE 237 


HR: 2 条 消息 。 
步骤 2: 2- (242-1) 条 消息 。 
#3: 2 . (2 T4211) 条 消息 。 
BRA: 至 多 2 . [4/2| 条 消息 。 
RAN, BIG, T(d) 《2 (202 4 2142 4] a/2|-1). 
对 于 偶数 4d，|d/2] = [d/2] = d/2; 对 于 奇数 d, |d/2] = (d/2)~1/2H [d/2] - (d/2) + 1/2; 
由 此 可 得 ， 
7(2c) =2:(2°+2°+c-1) =4:2°+2c-2, 
T(2c +1) =2-(2° +2° +¢-1) =6°2° +2¢-2. 
随后 ， 记 Fon) = Eln) /2"， 利 用 无 的 递归 关系 ， 可 得 


0 
F(n) = [eo pee ,否则 
我 们 可 以 把 Pn) 记 为 和 ， 并 且 以 无穷 级 数 为 办 


Td) _ © Td. 
F(n) = 5 Ran S ly Dae) 





现在 我 们 利用 上 述 对 于 奇数 4 和 偶数 d 的 7 的 表达 式 ， 并 将 条 件 分 类 为 指数 、 线 性 和 常数 
numerator， 可 得 


TA) SI) $TD 


4 2d+1 4 22c41 < pier? 


4:2° +2c-2 R62 +2c-2 
-9 ET 

















y (4:25 , 62° 2c 2 \ 6/2 2 \ 
= > Dre + Siar Dy a + rer? | ta + 22c+2 | 378 
1/foal 3 fac 3 fal 
=-37 | 之 元 te | | -了 | > 一 
2 之 5 8 da 2 Dy 
-31.2 43.16 3.4 
2 8 9 2 3 
=7+2-2 =52 
3 3 


由 此 可 得 ， Em<53N 
11.3.3 多 路 径流 量 算法 


作为 研究 线性 广播 算法 的 基础 ， 我 们 现在 提出 一 种 计算 n- 维 超 立方 体 上 方向 侦 听 的 算法 。 
该 算法 ,假设 一 个 处 理 器 被 指派 为 算法 的 初始 处 理 器 (领导 人 )， 领 导 人 的 链 路 可 任意 标 上 0， 
，7~1 中 的 数 。 初 始 处 理 器 的 标号 惟一 地 定义 了 方向 侦 听 ， 如 以 下 定理 所 示 。 
定理 11.20 设 w 是 节点 ， 亿 是 对 w 的 边 以 0，…，n-1 中 的 数 标号 。 那 么 存在 惟一 定向 人 ， 
对 于 mm 的 每 个 近邻 ， 满 足 C (v) = P(r), 


算法 准确 地 计算 这 个 定向 ， 并 且 惟一 的 计算 证 据 节点 标号 ， 在 节点 标号 中 ， 领 导 人 被 标 
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以 (0，…，0)。 算 法 利用 三 种 类 型 的 消息 。 领 导 人 在 消息 <dmn ，z> 中 ， 向 它 的 每 个 近邻 发 
送 连接 链 路 的 标号 ， 非 -领导 人 在 消息 <iam，mie> 中 ， 向 其 他 处 理 器 发 送 它们 的 节点 标号 。 
非 -领导 人 在 消息 <labl， 放 中， 通知 它们 的 近邻 连接 链 路 的 标号 。 


begin num_recy := 0 ; disp := 0 ; lblp := (0,…, 0) ; 
for | = 0 to n — 1 do (* Send for phase 1 *) 
begin send (dmn, l) via link | ; 
mpl = 1 


end ; 
while num_rec, < n do (* Receive for phase 2 *) 
begin receive (labl,!) ; (* necessarily via link J *) 
NUM_TECy := Num_recy + 1 
end 





图 11-8 超 立 方 体 上 的 定向 (初始 处 理 器 ) 算法 


begin num-_recy := 0; disp :=n+1; lol, := (0，… ,0) ; 
forall ! do nei,[l] := nil ; 
while num_recp < disp do (* Receive for phase 1 *) 
begin receive msg via link | ; num_rec, := num_recp +1 ; 
(* msg is a (dmn,i) or (iam, nla) message *) 
if msg is (dmn,i) then 
begin dis, := 1; 
neipll] := (0, … ,0) ; lblp[i] := 1 
(* So now lblp = (0, =- ,1, … ,0), with one 1 *) 
end 
else 
begin dis, := 1 + # of 1’s in nla ; 
lbl, := (lbl, or nia) ; 
neip{i] := nla 
end 
end ; 
(* Send for phase 1 *) 
forall / with nei,{l] = nil do 
send (iam, Ibi, ) via link J ; 
while num-_rec, < n do (* Receive for phase 2 *) 
begin receive (labl,i) via link | ; 
NUM-TECp := num_recy +1; mp[l] := i 
end ; 
(* Send for phase 2 *) 
forall / with neip[!] # nil do 
begin rp 所 := bit in which Jbl, and nei,|l] differ ; 
send (labl, rp 们 》via link / 
en 





图 11-9 超 立 方 体 上 的 定向 〈 非 -初始 处 理 器 ) 算法 


如 图 11-8 所 示 的 算法 ， 给 出 了 领导 人 的 算法 ， 如 图 11-9 所 示 的 算法 ， 出 了 非 -领导 人 的 算 
法 。 它 由 两 步 又 组 成 。 在 步 允 1 中 ， 消 息 流 远离 领导 人 ， 在 步 晴 2 中 ， 消 息 流 朝向 领导 人 。 节 
点 p 的 前 驱 (predecessor) 是 p 的 近邻 9， 其 中 d(g，w)< d(pP，w)。 节 点 p 的 后 继 ( successor ) 
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是 p 的 近邻 95， 其 中 dg(9，w) > d(p，w)。 在 超 立 方 体 上 ， 对 于 4d4(q,，w)= d(p，w)，gq 不 是 节点 
Pp 的 近邻 。 距 离 领 导 人 为 4 的 节点 有 d 个 前 驱 和 n-d 个 后 继 。 

领导 人 首先 通过 在 标号 为 ;的 链 路 上 发 送 消息 <dmn，i> 来 初始 化 算法 。 当 非 -领导 人 处 理 
器 p 得 知 它 距 领导 人 的 距离 dis。， 并 且 已 经 收 到 来 自 它 前 驱 的 消息 时 ，p 就 能 够 计算 它 的 节点 标 
号 nlia, 。 处 理 器 p 通 过 消息 <iam ，nlay> 向 它 的 后 继 转 发 这 个 标号 。 为 了 表明 p 确 实 能 够 这 样 做 ， 
首先 考虑 p 通 过 链 路 [接收 到 消息 <dmn，z> 的 情形 。 当 领导 人 发 送 消息 时 ，dis， = 1， 所 有 其 他 
的 近邻 都 是 后 继 。P 的 节点 标号 在 第 ;位 为 1， 在 其 他 位 为 0。( 在 这 种 情况 下 ， 链 路 /的 标号 变 为 
i.) 然后 ，p 经 过 所 有 kx 1 的 链 路 转发 消息 <iam ，mnia>。 

接 下 来 ， 考 虑 p 接 收 消息 <iam ，abe> 的 情形 。 这 条 消息 的 发 送 者 和 领导 人 间 的 距离 4 是 
由 此 消息 导出 的 (label 中 的 1 的 数目 )。 消 息 <iam ，label> 仅 被 发 送 到 后 继 中 ， 因 此 ， 发 送 者 
是 p 的 前 驱 ， 且 dis, = d + 1。 这 也 揭示 出 前 驱 的 数目 ，p 一 直 等 到 接收 到 dis, 条 消息 <iam ， 
label>。 然 后 ，p 计 算 它 的 节点 标号 作为 所 接 到 的 节点 标号 的 逻辑 析 取 ， 并 把 它 转发 到 没有 接 
到 消息 <iam，label> 的 那些 近邻 中 ， 因 为 它们 是 后 继 。 

在 步骤 1 中 ， 每 个 非 -领导 人 处 理 器 p 计 算 它 的 节点 标号 。 在 步 晴 2 中 ， 每 个 非 -领导 人 处 理 
器 p 从 它 的 后 继 得 知 指向 后 继 的 链 路 的 定向 ， 并 计算 指向 前 驱 的 链 路 的 定向 。 在 消息 <labl，i> 
中 经 过 这 条 链 路 发 送 这 个 信息 。 只 要 从 所 有 后 继 接 到 这 些 消 息 ， 处 理 器 就 向 其 前 驱 发 送 消息 
<labl，i>， 然 后 终止 。 当 从 所 有 近邻 接 到 消息 <labl， 必 时， 领导 人 终止 。 

处 理 器 p 的 变量 为 : num_rec, ， 表 示 已 经 接 到 的 消息 数 ; dis, ， 到 领导 人 的 距离 ( 当 第 一 
条 消息 到 达 时 计算 ,初始 化 为 n+1) ; 1bl,，p 所 计算 的 节点 标号 ; nei, [0..n-1]， 存 储 p 的 前 驱 
节点 标号 的 数组 ; m [0..n-1]， 用 于 存储 方向 侦 听 。 

引 理 11.21 算法 在 每 个 处 理 器 中 终止 。 

证 明 。 对 d 进 行 归纳 ， 容 易 证 明 ， 距 离 至 多 为 4 的 所 有 处 理 器 最 终 在 步 只 1 中 发 送 消息 。 对 
于 d = 0， 只 有 领导 人 自身 距离 领导 人 为 4， 它 才 可 能 在 没有 首先 接收 到 其 他 消息 时 ， 就 发 送 消 
息 。 假 设 在 步 双 1 中 ， 距 离 领导 人 为 4 的 所 有 处 理 器 发 送 所 有 消息 ， 并 考虑 距离 领导 人 为 对 1 的 
处理 器 p。 当 P 的 所 有 前 驱 最 终 向 z 发 送 步 允 1 中 的 消息 后 ，p 接 到 这 些 消 息 中 的 一 条 ， 并 设置 div, 
:= d+1。 当 p 接 收 到 它 的 所 有 d+1 个 前 驱 的 消息 时 ，p 自 己 发 送 步骤 1 中 的 消息 (向 它 的 后 继 )。 

Zibb, ATE, MALER RRS ROD MHA, HAR IE. 口 

引 理 11.22 ”终止 后 ，7 是 一 个 定向 。 对 于 经 过 链 路 /连接 的 近邻 p 和 9，1b1 和 了 10/ 仅 在 第 
mp [中 《等 于 ro 站) 位 不 同 。 

证 明 。 按 照 定理 11.20， 只 存在 一 个 定向 C FTE BARREN, WE L.P) =P .(p), 
AN (w= (0, =, 0)。 

在 步骤 1 中 ,处理 器 计算 节点 标号 NV。 正如 对 与 领导 人 的 距离 进行 归纳 所 证 明 的 那样 。 节 
点 w 设 置 1b1, 为 《0，…，0)， 它 就 是 (w)。 如 果 从 w 到 p 的 链 路 在 w 被 标号 为 i， 则 w 的 近邻 p 
用 4b; 为 1 设置 1b1,， 否 则 用 0 设置 。 因 此 ,lbl, = N p). 

现在 假设 距 w 为 d 的 所 有 节点 gq 计算 ibl, = VY (9)， 并 考虑 距 w 为 d + 1 的 节点 p。AV (p) 是 一 个 
串 ， 由 4d + 1 个 1 和 n-d-1 个 0 组 成 。 节 点 p 有 d+1 个 前 驱 ， 对 于 前 驱 g 而 言 ， REEN 4p) 中 的 一 
个 1 变 成 0 就 找到 了 NV (9)。 因 此 ， 把 4 +1 个 标号 VY (q) 的 析 取 就 是 p). 

步骤 1 之 后 ， 对 于 经 过 链 路 /连接 的 p 的 前 驱 q， nei, [I] = ibl, FEA MAb, 4lb1,Anei, [NCE 
某 一 位 不 同时 ，p 才 计算 交趾 。 因此 尼 5 和 了 尼 5 只 在 位 灰 [ 中 不同。 当 4 接 到 p 的 消息 <labl， wli, 
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4 在 这 条 链 路 上 也 使 用 同样 标号 。 口 
总 之 ， 图 11-8 和 图 11-9 所 示 的 算法 定向 于 具有 领导 人 的 超 立 方 体 ， 需 要 交换 2. IEI 条 消息 。 
消息 复杂 度 渐 进 地 最 优 ， 参 见 推论 11.27。 


11.3.4 使 用 掩 码 的 有 效 超 立方 体 算法 


图 11-8 和 图 11-9 所 示 的 算法 可 被 用 于 在 未 标号 的 超 立 方 体 上 执行 其 他 的 任务 [DRT98]。 人 
们 甚至 可 以 通过 从 发 送 消息 中 排除 一 些 处 理 器 ， 而 使 用 更 少 的 消息 。 这 可 以 通过 定义 一 个 掩 
4% (mask) 来 实现 ， 掩 码 是 长 度 为 "的 位 串 的 子 集 。 一 旦 计算 出 它 的 节点 标号 ， 处 理 器 就 检查 
是 否 这 个 标号 在 掩 码 中 〈 掩 码 被 预先 定义 ， 且 为 全 部 处 理 器 所 知 ) 。 当 且 仅 当 标号 在 掩 码 中 ， 
处 理 器 将 发 送 消息 ， 就 像 在 图 11-8 和 图 11-9 所 示 的 算法 中 所 规定 的 那样 。 

1. 掩 码 算 法 的 解释 

M 是 Z 的 子 集 ， 即 长 度 为 n 的 位 串 的 集合 。 用 Mi 表示 只 包含 t 个 1 的 位 串 的 集合 M。 可 以 理 
解 ， 掩 码 必须 满足 一 些 条 件 ， 并 且 要 对 算法 作出 一 些 修改 ， 我 们 现在 对 此 作出 解释 。 首 先 ， 
位 串 00...00 总 是 在 M 中 ， 初 始 处 理 器 的 近邻 一 旦 接 到 消息 <dmn，i>， 就 计算 它们 的 标号 。 而 
掩 码 中 的 其 他 节点 必须 接收 到 至 少 两 个 前 驱 的 消息 才能 开始 计算 它们 标号 。 因 此 ， 对 于 串 v E 
M (其 中 > 2)， 一 定 至 少 有 两 个 前 驱 x 和 ?在 Mi 中。 

现在 解释 技术 上 的 细节 。 由 于 x 和 y 是 v 的 前 驱 ，v 是 x 和 y 的 共同 后 继 ， 但 是 x 和 y 也 有 共同 前 
虹 ， 记 为 wx。 确实 有 两 个 接收 到 x 和 y 的 消息 的 处 理 器 ， 它 们 是 处 理 器 v 和 w。 我 们 要 求 ， 通 过 假 
设 w 也 在 掩 码 中 ，x 和 y 发 送 之 前 ，x 和 y 的 共同 前 驱 已 经 计算 了 它 的 标号 。 

定义 11.23 #ORFRM CZ, BA 

(1) ~” EM, 

(2) 对 于 "E Mi， 其 中 k>2， 存 在 x，yE Mi 是 v 的 前 驱 。 

(3) 如 果 和 它 的 两 个 前 驱 x 和 ?部 在 M 中 ， 那 么 ，x 和 ?的 共同 前 驱 在 M 中 。 

给 定 (共同 已 知 的 ) 掩 码 M， 算 法 操作 如 下 。 

(1) 初始 处 理 器 在 链 路 i 上 发 送 消 息 <dmn，i>， 其 中 i 的 二 进 制 表示 为 00..…1...00 E M (其 
中 1 在 第 i 个 位 置 ) 

(2) 处 理 器 一 旦 收 到 这 个 消息 ， 就 计算 它 的 标号 1b1, = 00...1...00， 并 且 (因为 它 在 M 中 ) 
通过 所 有 其 他 边 发 送 消息 <iam，ibl,>。 

(3) 处 理 器 一 旦 收 到 两 条 消息 <iam，/>， 且 这 两 条 消息 的 串 中 包含 相同 个 数 的 1， 一 个 节 
点 就 可 计算 标号 vx， 它 是 这 两 个 标号 的 共同 后 继 。 

如 果 这 个 标号 不 在 M 中 : 忽略 所 有 进一步 的 消息 。 

如 果 这 个 标号 在 M 中 : 等 待 接收 来 自 位 于 M 中 的 vy 的 所 有 前 驱 的 消息 <iam ，v>， 然 后 通过 
所 有 链 路 发 送 消息 <iam ，v>。 

观察 可 见 ， 该 算法 计算 的 信息 较 之 图 11-8 和 图 11-9 所 示 的 算法 要 少 。 对 于 那些 节点 标号 在 
M 中 的 处 理 器 ， 才 计算 它 的 节点 标号 ,而 只 有 两 端 都 在 M 中 的 链 路 ， 才 计算 它 的 链 路 标号 。 但 
是 它 也 使 用 较 少 的 消息 : 其 消息 数 可 用 nn. IMI 限 定 。 因 为 只 有 标号 在 M 中 的 节点 才 发 送 消 息 ， 
每 次 至 多 发 送 n 条 消息 。 

2. 发 送 和 广播 的 小 撞 码 

我 们 现在 能 观察 到 类 似 于 11.2.3 小 节 的 一 个 现象 。 对 算法 的 微调 并 不 集中 在 算法 方面 的 问 
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题 ， 而 是 一 个 关于 掩 码 性 质 的 组 合 练习 。 

我 们 考虑 的 第 一 个 任务 是 FarSend， 其 中 初始 处 理 器 向 距离 为 4 的 某 个 节点 发 送 消 息 ， 假 
设 它 的 标号 是 140”…*。 这 个 地 址 可 以 解释 为 初始 处 理 器 的 “私有 ”方向 侦 听 ， 即 初始 处 理 器 的 
局 部 链 路 标号 ， 它 当然 无 需 与 其 他 节点 处 的 定向 一 致 。 回 忆 开 始 时 ， 除 了 初始 处 理 器 ， 其 他 
节点 都 没有 任何 它 的 节点 和 链 路 标号 的 知识 ! 

引 理 11.24 存在 包含 标号 140"”4， 且 大 小 为 1+ AD 4 He A 

R. EAM = {010 : i+k<d } 请 足 所 要 求 的 性 质 。 

因此 ， 在 无 标号 的 超 立 方 体 上 ，FarSend 仅 花费 O( d?n) 条 消息 。 文 献 [DRT98] 中 证 明 ， 
这 个 掩 码 的 大 小 是 最 优 的 。 我 们 用 已 ,表示 ，FarSending 将 一 条 消息 发 送 给 标号 为 v 的 节点 的 
掩 码 。 

可 用 有 覆盖 整个 网 络 的 掩 码 解 决 广播 任务 。 即 每 个 茹 点 都 包含 在 掩 码 中 ， 或 者 与 掩 码 中 的 
一 个 节点 近邻 。 然 而 ， 为 了 得 到 线性 的 复杂 度 ， 掩 码 应 该 至 多 包含 O(N/n) 个 节点 ， 还 不 知 
道 是 否 存在 同样 大 小 的 覆盖 掩 码 。 因 而 ， 广 播 算 法 利用 FarSend 把 消息 传输 到 所 选 节点 的 一 个 
更 稀疏 的 集合 中 ， 然 后 从 这 个 集合 ， 经 过 有 限 次 的 跳跃 将 其 进行 扩散 。 因 为 FarSend 每 次 将 
Olo) 条 消息 传输 到 一 个 节点 上 ， 因 此 算法 的 主 节点 数 为 N/m3。 

命题 11.25 存在 集合 C CZ, BR 

a) co 

(2) 对 于 每 个 EZ, d (x, C) 《3。 

广播 算法 使 用 命题 中 确定 的 集合 ， 它 的 成 员 称 为 主 节 点 (chief). HRIH, EETA 
通过 FarSend 接 到 初始 处 理 器 的 消息 。 步 又 2 中 ， 每 个 主 节点 以 3 为 距离 扩散 销 息 ， 即 把 消息 发 
送 到 每 个 近邻 中 ， 近 邻 再 把 消息 转发 到 它们 的 近邻 中 ， 后 者 再 转发 一 步 到 它们 的 近邻 中 。 

现在 观察 ， 因 为 C 的 第 二 个 性 质 ， 每 个 节点 在 步骤 2 中 接 到 消息 。 下 面 ， 考 虑 复杂 度 。 
为 每 个 主 节点 以 O(mw) 条 消息 可 达 ， 对 C 的 大 小 的 限定 蕴含 着 ， 步 骤 1 的 消息 复杂 度 是 线性 的 。 
因为 主 节 点 有 nm 个 近邻 ， 且 有 (DF) 到 个 近邻 的 近邻 ， 在 步 又 2 中 这 些 节点 中 的 每 个 节点 发 
送 " 条 消 息 ， 因 此 步骤 2 的 消息 复杂 度 也 是 线性 的 。 

3. 另 一 种 应 用 : 远程 定向 (FarOrient) 

掩 码 算 法 可 以 用 于 一 个 节点 相对 于 另 一 个 节点 的 定向 。 假 设 节 点 v 想 要 对 距离 为 4 的 某 个 
节点 定向 ， 即 这 个 节点 必须 对 所 有 它 的 边 重新 标号 ， 且 要 与 在 v 处 的 边 标 号 一 臻 。 节 点 4 从 包 
含 v 的 所 有 近邻 的 掩 码 人 MM 开始 运行 掩 码 算法 。 由 于 v 将 通过 每 一 条 链 路 接收 消息 <iam，/>， 它 
将 能 够 计算 每 条 链 路 的 方向 。 可 以 证 明 [DRT98]， 存 在 大 小 约 为 n. d 的 掩 码 ， 并 且 这 个 掩 码 是 
最 优 的 ，FarOrient 的 消息 复杂 度 为 O(n)。 


11.3.5 无 标号 超 立 方 体 上 的 选举 算法 


最 有 效 的 超 立 方 体 上 的 选举 算法 基于 归并 树 原 理 。 如 在 Galleger-Humblet-Spira 算 法 
(7.3.2 小 节 ) 中 所 用 的 那样 。 超 立方 体 的 拓扑 性 质 可 用 于 降低 复杂 度 。 本 节 试 图 描述 最 重要 的 
技术 , 但 这 里 没有 给 出 算法 的 完整 描述 ， 参 见 文献 [Dob99]。 

GHS 算 法 的 消息 复杂 度 为 B(N log N + m)。 这 是 最 优 的 算法 (无 拓扑 结构 知识 )。 这 两 项 
代表 不 同 含义 。 算 法 的 一 个 组 成 部 分 表示 搜索 离开 当前 子 树 的 一 条 边 : GHS 算 法 测试 每 条 边 ， 
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寻找 它 与 另 一 棵 树 可 能 的 归并 。 只 有 线性 次 数 的 这 种 党 试 取得 了 成 功 ， 在 大 多 数 情况 下 ， 找 
到 这 条 边 ， 就 可 返回 到 同一 棵 子 树 的 一 个 成 员 。 而 那些 不 成 功 的 搜索 ， 其 复杂 度 为 nm， 代 表 消 
息 复杂 度 中 的 第 二 项 。 算 法 的 另 一 部 分 是 对 两 棵 大 小 分 别 为 4, 和 ws 的 子 树 进行 归并 ， 得 到 大 小 
为 nitn; 的 一 棵 子 树 。GHS 算 法 对 较 小 的 一 棵 子 树 重新 标号 ， 因 此 以 min(n,，n2) 条 消息 实现 
了 归并 。 这 使 得 归并 的 总 代价 为 B(N log N). 

为 使 选举 的 代价 降低 ， 我 们 需要 对 未 能 成 功 尝试 的 边 的 数目 进行 限制 ， 并 且 必 须 减 少妇 
并 子 树 的 代价 。 在 Dobrev 算 法 的 步 又 1 中 ， 节 点 开始 按照 广度 优先 搜索 (breadth-first search) 
方法 ,构造 一 棵 深度 为 常数 (5) 的 子 树 。 超 立方 体 的 拓 扩 结构 蕴含 着 对 不 成 功 搜索 尝试 的 次 
数 的 限定 。 离 根 的 距离 为 5 的 节点 在 树 的 第 4 层 只 有 5 个 近邻 ， 因 此 成 功 搜索 只 用 5 次 比较 ， 这 
是 一 个 常数 。 因 此 ， 用 可 接受 的 较 低 的 代价 可 以 构造 深度 为 5 的 BFS 树 。 

如 果 一 棵 树 包含 离 根 的 距离 为 5， 而 距 某 一 中 心 节点 的 距离 少 于 5 的 全 部 节点 ， 就 要 使 用 
另 一 种 扩展 技术 。 因 为 至 多 还 有 O(N/m) 棵 树 ， 每 次 归并 的 m5 条 消息 的 代价 是 可 接受 的 。 在 
一 棵 树 的 中 心 ， 可 用 相对 位 置 的 列表 表示 这 棵 树 。 但 在 其 他 地 方 用 “ 专 有 ”方向 侦 听 表示 。 
即 如 果 把 中 心 的 局 部 边 标 号 扩展 到 整个 图 上 ， 就 会 产生 方向 侦 听 。 

有 了 这 种 格式 的 整 棵 树 之 后 ， 中 心 节点 可 以 确定 出 对 树 进行 扩展 的 位 置 : 一 个 离 这 棵 树 
距离 为 5 的 点 。 如 果 不 存在 这 样 的 点 ， 中 心 就 变 成 领导 人 ; RARER, HHL, KE 
在 属于 另 一 棵 子 树 的 半径 为 5 的 球 。 用 FarOrienr 方 法 可 以 靠近 这 个 所 选择 的 点 ， 从 该 点 扩展 这 
棵 树 ， 或 者 用 BFS 扩 展 5 层 ， 或 者 通过 与 另 一 棵 子 树 的 归并 扩展 。 

为 了 归并 两 棵 树 ， 一 个 中 心 的 位 置 列 表 被 转化 为 另 一 个 中 心 的 方向 侦 听 。 这 可 以 通过 
FarOrient 完 成 ， 由 它 来 确定 两 个 节点 定向 的 相互 一 致 性 。 所 得 算法 完全 不 简单 ， 对 于 它 的 分 
析 是 当前 研究 的 课题 。 


11.4 与 复杂 度 有 关 的 问题 


在 前 面 的 几 节 中 ， 主 要 研究 了 方向 侦 听 和 拓扑 结构 知识 的 主题 。 我 们 现在 继续 研究 另外 
一 些 没 有 多 少 相关 性 的 问题 。 它 们 中 的 一 些 是 当前 研究 的 中 心 。 


11.4.1 团 或 任意 图 的 定向 


了 解 到 方向 侦 听 可 以 减少 某 些 任务 的 复杂 度 ， 我 们 的 问题 是 ， 是 否 在 没有 给 定 方向 侦 听 
的 网 络 中 ， 可 以 计算 出 方向 侦 听 。 为 了 与 有 方向 图 中 边 操作 不 相 混 清 ， 我 们 称 计 算 方 向 侦 听 
的 问题 为 网 络 定向 。 本 节 中 ， 我 们 证 明了 对 图 定向 的 消息 复杂 度 的 下 界 ， 提 出 了 网 络 定向 的 
几 种 算法 。 

1. 定向 算法 的 下 界 

因为 要 对 网 络 定向 ， 需 要 在 每 一 条 边 上 设置 标号 ， 如 同 第 一 个 定理 证 明 中 的 那样 ， 需要 
利用 每 一 条 边 。 

定理 11.26 每 次 执行 中 ， 任 何 定向 算法 至 少 交换 站 -1/2N 条 消息 。 

证 明 。 对 于 链 路 标号 也， 设 Prw(v，w 是 u 的 近邻 ) BPO” (vy) =P w), Pa” (w) = 
P.D)， 以 及 刀 ”" 在 关中 的 所 有 其 他 标号 所 定义 的 标号 。( ERP (FIP Av) TEP”) 如 
RL BEA, WL W)=-L dul, CV, AU, Loa Ben. 

75 EE BE — AT, WRAP. BEIER, 每 个 节点 上 有 一 个 排列 r, (L =r 
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(P)B—A* EI). SMB ERR, Re WIR A OA) 它 的 两 个 近邻 v 和 w 发 
送 (接收 ) 消息 。 由 于 u 没 有 与 v， 或 者 w 通 信 ， 如 果 网 络 初 始 时 标号 为 P"***， 且 所 有 处 理 器 
终止 于 同一 个 排列 ， 那 么 执行 有 可 能 相同 。 然 而 ，L = a P) = L** 不 是 一 个 定向 ， 算 法 
是 不 正确 的 。 

由 此 可 得 ， 在 每 次 执行 中 ， 每 个 节点 必须 至 少 与 除了 一 个 以 外 ， 所 有 它 的 近邻 进行 通 
信 。 口 

推论 11.27 。”N 个 顶点 国 的 定向 需要 交换 @(N2) 条 消息 ，7m- 维 超 立 方 体 的 定向 需要 交换 包 
(na) 条 消息 ,xm 国 环 的 定向 需要 交换 @(2) 条 消息 。 

2. 团 的 定向 

团 的 定向 算法 (图 11-10 所 示 的 算法 ) 赋 给 每 个 处 理 器 惟一 的 编号 ， 号 码 范 围 为 0，…， 
N-1。 在 接 到 每 个 近邻 的 名 字 之 后 ， 每 个 处 理 器 计算 它 在 由 所 有 名 字 组 成 的 集合 中 的 序号 。 
每 个 近邻 的 序号 可 以 被 类 似 地 计算 ,近邻 序号 和 它 自己 的 序号 的 差 ， 为 链 路 标号 。 

算法 依赖 节点 中 不 同 标识 的 可 用 性 ， 但 是 很 容易 修改 ， 而 变 成 使 用 领导 人 的 算法 。 在 这 
种 情况 下 ， 领 导 人 开始 向 它 的 近邻 发 送 1 至 N-1 的 数 ， 然 后 这 些 数 被 用 作 标识 。 与 寻找 链 路 标 
号 相 比 ， 分 发 这 些 不 同 的 数 的 代价 较 小 〈《N 条 消息 ) ， 因 为 按照 定理 11.26， 寻 找 链 路 标号 的 代 
价 为 消息 数 的 平方 。 





begin for l = 1 to N — 1 do send (name,p) via l ; 
recp := 0; 
while rec, < N — 1 do 
begin receive (name, n) via link | ; 
TECp := recp +1; neip|i] := n 
end ; 
(* Compute node label *) 


lblp := #{k : neip[lk] < p} ; 
for l =1 to N -1 do 
begin (* Compute neighbor’s node label and link label *) 
ll := #{k : net,[k] < neipll]} ; 
if p < neipll] then H :=U+1 ; 
Toll] := (U — Iblp) mod N 





图 11-10 团 的 定向 算法 


3. 任意 网 上 弦 方 向 债 听 

在 任意 网 络 上 ， 假 如 用 一 个 节点 作为 起 始 节点 ， 可 以 用 一 个 遍历 网 络 的 令 牌 ， 如 ， 深 度 
优先 搜索 遍历 ， 对 节点 进行 编号 。 遍 历 用 2m 条 消息 (每 条 消息 在 每 个 方向 上 通过 每 条 边 ) ， 节 
点 按照 被 访问 的 次 序 编号 。 在 遍历 过 程 中 ， 处 理 器 得 知 自 己 的 编号 ， 也 得 知 近邻 的 编号 ， 然 
后 就 能 够 计算 弦 方 向 侦 昕 。( 必 须 已 知 节点 数 。 如 果 预 先 不 知道 节点 数 ， 就 要 在 遍历 的 过 程 中 
计数 ， 并 从 初始 处 理 器 利用 N-1 条 消息 将 这 条 消息 广播 出 去 。) 


11.4.2 位 复杂 度 和 多 路 径流 量 算法 


我 们 现在 通过 考虑 超 立 方 体 上 定向 算法 的 位 复杂 度 ， 来 更 详细 地 评估 复杂 度 。 定 理 11.26 
已 经 缠 含 着 消息 数 的 界限 。 但 是 对 其 扩展 ， 就 能 对 算法 的 位 复杂 度 进行 界定 。 
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5111.28 在 n- 维 超 立 方 体 的 定向 算法 中 ， 每 个 节点 通信 的 位 复杂 度 至 少 为 Q (n logn). 

证 明 。 已 经 解释 ， 节 点 至 少 通信 盖 1 条 消息 才能 区 分 它 的 "条 链 路 。 为 了 真正 区 分 这 些 链 
路 ， KABA lel, ABS EMBL ARQ (log n) 位 。 口 

多 路 径流 量 算法 (11.3.3 小 节 ) 中 使 用 的 消息 包含 节点 的 标号 ， 其 占用 "位 。 现 在 证 明 ， 
只 用 O(log n) 位 的 消息 就 可 以 实现 算法 。 

算法 不 需要 包含 在 <iam，iabel> 中 的 所 有 信息 。 有 许多 元 余 。 只 要 传输 1 的 个 数 、 捉 中 为 
1 的 最 小 下 标 ， 以 及 对 应 1 的 下 标 和 ( 模 n)。 对 于 一 个 节点 ， 标 号 label 定 义 1 的 个 数 、 最 小 下 标 
以 及 下 标 和 为 wgt( label) = #{i: b;=1}; low(label) = min{i: b;=1}; ixs(label) = (Ea =i) 
mod n。 定 义 综合 (summary) 为 三 元 组 smy (label) = (wet (label), low( label), ixs(label)). 
节点 的 综合 就 是 其 节点 标号 的 综合 。 

引 理 11.29 设 p 是 距离 w 为 4 +1>2 的 节点 。 

(1) 由 p 的 一 个 前 驱 的 综合 可 导出 dis, = d +1。 

(2) 从 p 的 d +1 个 前 驱 的 综合 ， 可 计算 出 p 的 综合 。 

(3) 从 p 的 综合 以 及 p 的 d +1 个 前 驱 的 综合 ， 可 计算 出 p 的 节点 标号 。 

(4) 由 p 的 节点 标号 和 4 的 综合 ， 可 计算 出 p 的 前 驱 g 的 节点 标号 。 

证 明 。(1) 由 wgt( N (q)) 与 4(q,，w) 相等 ，dis, 的 计算 平凡 。 | 

(2) 现在 设 给 定 p 的 d +1 个 前 驱 的 综合 。 那么 ，d +1 个 综合 的 4d， 其 low 值 等 于 low( N (p)), 
而 一 个 综合 有 更 高 的 ow 值 (通过 将 NY (p) 中 第 一 个 1 变 为 0 而 得 其 标号 的 前 驱 )。 这 给 出 
low( N (p)) 值 ， 同 时 也 确定 节点 标号 的 下 标 和 irso， 该 节点 标号 与 W(p) 在 位 置 I ow 不同 。 
因此 ，ixs( N (p)) = (ixso+ low( NN (p)))mod n。 这 就 完成 了 smy( Af (p)) 的 计算 。 

(3) 对 4 进行 d +1 次 选择 作为 p 的 前 驱 ， 计 算 ixs( N(P))-is( N (q))mod n, 48N (p) 
中 1 的 d +1 个 位 置 。 

(4) 对 于 p 的 前 驱 q, EN (p) H, 把 下 标 (ixs( VY (p))-ixs (N (q))mod n) 对 应 的 位 
从 1 变 到 0 就 得 到 A/ (a). o 

由 引 理 11.29 可 得 ， 在 定向 算法 中 ， 只 发 送 节点 标号 的 综合 ， 无 需 发 送 整 个 标号 ， 因 此 ， 
FAO (logn) 位 就 可 实现 算法 。 


11.4.3 Verweijj 随 机 漫步 算法 


我 们 现在 给 出 Verweij[VT95] 提 出 的 随机 Monte Carlo 选 举 算法 。 它 适合 于 任意 的 拓扑 结构 ， 
也 没有 利用 方向 侦 听 ， 因 为 它 是 基于 竞争 的 随机 漫步 的 设计 理念 。 

初始 了 时， 每 个 处 理 器 处 于 睡眠 状 态 ， 一 旦 处 理 器 苏醒 (自然 地 出 现 这 种 状态 ， 或 者 在 睡 
占 状态 中 接 到 消息 )， 它 就 产生 包含 自己 标识 和 跳 数 计数 器 的 令 牌 。 在 网 络 中 按照 随机 漫步 算 
法 转发 令 牌 ,并 且 该 令 牌 可 被 具有 更 大 标识 的 令 牌 所 访问 过 的 处 理 器 从 网 络 中 删除 。 当 令 牌 
完成 K 步 ， 还 没有 被 删除 时 ， 持 有 该 令 牌 的 处 理 器 被 选中 ， 参 见 图 11-11 所 示 的 。 

1. 算法 如 何 工作 

被 初始 化 的 最 大 令 牌 不 会 被 杀 死 ， 因 此 ， 这 个 令 牌 会 完成 K 步 ， 并 使 一 个 进程 变 成 领导 人 ， 
这 被 称 为 正确 的 领导 人 ， 这 个 性 质 蕴含 着 ， 算 法 仅 在 选 出 多 个 领导 人 的 失败 。 而 不 是 在 根本 
选 不 出 领导 人 有 时， 失败 。 

如 果 任 何 一 个 非 最 大 值 的 令 牌 成 功 地 完成 了 K 步 ， 而 没有 进入 已 被 更 大 令 牌 访问 过 的 处 
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理 器 ， 算 法 就 会 失败 〈 即 选 出 多 于 一 个 领导 人 )。 所 选 的 领导 人 为 假 领导 人 。 可 以 通过 增加 天 
值 ， 来 减少 出 现 这 种 假 声明 的 可 能 性 ， 但 由 于 令 牌 要 进行 E 步 之 多 ， 增 加 K 值 也 增加 了 消息 的 
复杂 度 。 


cons K (* Safety parameter *) 


var state : (sleep, awake, leader) init sleep ; 
matidp ; (* Highest identity seen *) 


To start an election: 
begin i := p ; s := 0 ; magid, :=1; 
ifs<K 
then send (walk, ¿,s + 1) through a random edge 
else state, := leader 
end 


Upon arrival of token ( walk, i, s): 
begin if state, = sleep then start an election ; 
receive ( walk, i, s) ; mazid, := max(mazidp, i) ; 
if i = maridp 
then if s< K 
then send ( walk, i, s + 1) through a random edge 
else statep := leader 
else (* Kill token *) skip 
end 





图 11-11 选举 算法 (对 于 处 理 器 p) 


对 于 K = 0， 每 个 令 牌 产生 假 的 声明 结果 。 因 此 ， 错 误 的 概率 是 非常 大 的 〔1)， 但 是 消息 - 
的 复杂 度 低 (0)。 另 一 方面 ， 如 果 K 趋 于 %， 错 误 的 概率 就 会 收敛 到 0。 因 为 不 存在 最 大 令 牌 
可 以 进行 无 限 多 步 ， 仍 然 以 正 概率 如 免 最 大 处 理 器 。 
幸运 的 是 ， 对 于 算法 的 正确 性 或 者 算法 的 复杂 性 质 ，K 的 选择 并 不 是 非常 关键 的 。 首 先 ， 
即使 k 值 很 小 ， 消 息 的 复杂 度 至 少 是 关于 N 的 线性 关系 ， 因 为 每 个 处 理 器 可 能 产生 一 个 令 牌 。 
其 次 ， 选 择 比 获得 期 望 的 可 靠 性 所 必须 的 更 大 的 K 值 ， 会 产生 额外 的 令 牌 步 ， 但 是 .( 以 更 大 概 
率 ) 仅 对 最 大 令 牌 适合 。 讨 论 可 得 ， 只 要 Kk 值 超出 最 小 值 一 个 线性 量 ， 产 进 的 期 望 的 消息 数 就 
不 会 受到 kK 的 影响 。 
目前 对 于 复杂 度 的 数学 分 析 和 所 需 的 K 值 还 一 无 所 知 。 这 是 一 个 尚 待 解决 的 问题 。 随 后 ， 
我 们 会 描述 它 为 什么 是 一 个 困难 的 问题 ， 并 结合 定时 假设 ， 给 出 一 个 完整 、 有 竞争 力 的 分 析 . 
2. 定时 假设 
K 的 最 优 值 和 算法 性 能 受到 令 牌 相对 速度 的 影响 。 下 面 的 讨论 针对 网 络 是 团 的 情况 。 即 令 
牌 的 每 个 连续 步 可 以 导致 一 个 完全 随机 的 节点 。 
一 种 极端 的 情形 是 ， 与 次 最 大 令 牌 相 比 ， 最 大 令 牌 无 限 的 慢 。 这 里 ， 仅 当 次 最 大 令 牌 进 
入 最 大 处 理 器 时 才 被 杀 死 ， 例 如 ， 在 团 上 ，K 必 须 为 线性 值 ， 才 能 以 接近 于 1 的 概率 保证 做 到 
这 一 点 。 
考虑 消息 的 复杂 度 ， 最 坏 的 定时 出 现在 ， 仅 当 所 有 具有 较 小 标识 的 令 牌 都 已 被 杀 死 时 ， 
才 接 到 令 牌 的 时 候 。 然 后 ， 仅 当 被 一 个 具有 更 大 标识 的 处 理 器 接收 时 ， 令 牌 才 被 杀 死 ， 对 于 B 
第 (i+1) 个 最 大 的 标识 ， 仅 当期 望 的 Q(N/i) 步 后 ， 这 种 情况 才 会 发 生 。 讨 论 落 含 着 ， 在。 i 
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*EeASWAL, BISA AQ(N log N). 

另 一 方面 ， 考 虑 同步 轩 上 的 例子 ， 在 任何 时 刻 ， 每 个 幸存 的 令 牌 前 进步 数 相等 。 在 
OC YN ) 步 后 ， 最 大 的 令 牌 已 经 访问 了 O( YN ) 处 理 器 。 在 经 过 另 一 个 O( VN ) 步 后 ， 第 二 
个 令 牌 以 接近 于 1 的 概率 进入 这 些 处 理 器 之 一 。 因 此 , K = O( YN ) 足以 以 大 概率 杀 死 第 二 个 
最 大 的 令 牌 。 由 较 小 令 牌 做 出 假 领导 人 的 声明 的 概率 是 很 小 的 。 

3. 复杂 度 的 模拟 研究 

文献 [VT95] 在 团 和 超 立 方 体 上 对 算法 进行 了 模拟 ， 来 实验 性 地 确定 它 的 复杂 度 。 消 息 复 
杂 度 约 为 3N。 可 见 这 种 度量 远 远 好 于 完全 异步 情形 下 所 能 证 明 的 复杂 度 。 雍 比 含 着 ,为 了 导 
出 复杂 度 的 解析 式 ， 必 须 考虑 定时 假设 (参见 Archimedean 假 设 )。 


11.5 结论 和 未 解决 的 问题 


我 们 已 经 看 到 , 方向 侦 听 可 以 有 效 地 利用 网 络 的 拓扑 结构 , 使 得 处 理 器 之 间 的 通信 更 直接 。 
研究 方向 侦 听 的 性 质 是 每 年 一 度 的 SIROCCO (Structural InfoRmatiOn and Communication 
COmplexity) 会 议 的 主题 。SIROCCO 会 议 文集 由 Carleton 大 学 出 版 社 出 版 。 


11.51 利用 方向 侦 昕 


在 11.1.2 小 节 中 ， 指 出 方向 侦 听 具 有 诸多 方面 的 用 途 。 路 径 比 较 的 能 力 使 它 有 可 能 回避 广 
播 和 选举 算法 的 下 界 Q(m)， 因 为 不 再 需要 通过 边 发 送 消息 来 验证 ， 按 照 算法 是 否 已 经 到 达 近 
令 。 路 径 比 较 展 现 了 任意 网 上 线性 广播 和 O(N log N) 选举 的 可 能 性 。 

路 径 压 缩 使 通过 最 短路 经 到 达 已 知 位 置 的 节点 成 为 可 能 。11.2 节 表明 了 它 在 弦 环 上 的 选举 
算法 中 的 用 图 。 通 过 为 弦 选择 各 种 设置 ， 可 以 精细 化 调整 路 径 压 缩 的 数量 。 可 以 证 明 ， 即 使 
内 利用 适量 的 弦 数 ， 路 径 压缩 仍然 可 以 导致 线性 选举 算法 。 路 径 压 缩 的 使 用 要 求 方向 侦 听 是 
一 致 的 。 

11.2 节 把 路 径 压缩 比 作 方 向 侦 听 的 第 三 种 能 力 : 充分 利用 蕴含 在 一 致 方向 侦 听 中 的 拓扑 知 
识 。 已 经 证 明 ， 如 果 在 算法 中 利用 这 种 知识 ， 只 需 更 少 的 蓄 数 就 能 够 获得 线性 的 选举 算法 。 


11.5.2 复杂 度 归 约 


图 11-12 概 述 了 本 章 中 所 报告 的 许多 成 果 。 给 出 了 广播 和 选举 算 靶 在 各 种 网 络 结构 上 的 消 
息 复 杂 度 ， 考 虑 了 三 种 假设 : 第 一 种 假设 没有 拓扑 结构 知识 和 方向 侦 听 因为 算法 不 “知道 
它 处 在 哪 种 拓扑 结构 中 ， 拓 扑 结构 知识 和 方向 侦 听 均 要 求 算法 通过 每 条 边 发 送 消息 ; 第 二 种 
假设 只 有 拓扑 结构 知识 可 用 ， 这 种 情况 使 得 算法 可 以 利用 网 络 图 的 性 质 ， 但 边 的 方向 未 知 ; 
最 后 一 种 假设 给 定 拓扑 结构 知识 和 方向 侦 听 。 


任意 网 


GLK (2) 
LER 
超 立 方 体 





图 11-12 结构 化 知识 和 复杂 度 
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图 11-12 (4%) 


注释 : (1) 拓扑 结构 知识 与 这 类 网 络 无 关 。 
(2) < 是 弦 数 ， 假 设 cslog N。 
(3) 是 否 只 用 TA 就 能 达到 改进 ， 未 知 。 
最 右 列 报告 了 是 否 结构 化 信息 有 助 于 降低 任务 的 复杂 度 。 除 了 在 圆 环 上 的 广播 之 外 ( 即 B93) 
使 不 知道 网 络 是 圆 环 ， 线 性 消息 复杂 度 也 可 以 广播 .) 结构 信息 可 以 降低 消息 复杂 度 。 然 而 ， 
在 大 多 数 情况 下 ， 这 种 复杂 度 的 降低 是 由 于 利用 了 拓扑 知识 。 不 包括 任意 网 络 上 的 消息 复杂 
度 的 降低 ， 团 上 的 选举 一 直 是 惟一 的 任务 ， 对 于 这 个 任务 ， 有 向 边 降低 了 消息 复杂 度 。 
如 果 按 照 渐进 消息 复杂 度 这 不 是 优点 的 话 ， 方 向 侦 听 还 有 其 他 一 些 好 处 : 算法 简单 、 隐 
含 的 常量 更 小 ， 以 及 更 好 的 时 间 复 杂 度 。 


11.5.3 当前 研究 


当前 的 研究 方向 包含 如 下 儿 个 方面 : 

(1) 针对 一 般 路 由 策略 ,证 明 引 理 11.11 和 引 理 11.14。 

(2) 纺 长 : 取 何 值 时 ，1- 弦 算法 可 被 修改 ， 使 它 仍然 具有 线性 的 消息 复杂 度 ? 

(3) 计算 随机 漫步 选举 算法 的 期 望 复杂 度 (对 于 团 、 超 立方 体 和 回环 )。 

(4) 基于 不 可 交换 群 ， 概 述 本 章 的 方向 侦 听 的 结果 。 这 样 的 概述 将 会 是 有 趣 的 。 例 如 ， 
利用 排列 群 定义 的 立方 连接 的 环 网 。 


习题 


11.1 节 
11.1 设 L 是 用 群 G 中 的 元 素 对 边 的 标号 。 用 SUM (P) 表示 路 径 P 上 找到 的 标号 的 和 。 证 
明 以 下 两 种 说 法 是 等 价 的 。 
(1) £ 是 方向 侦 听 。 
(2) 路 径 P 是 闭 的 ， 当 且 仅 当 SUM(P) = 0。 
11.2 节 


11.2 (ME) 对 于 任意 路 由 策略 ， 证 明 Q(loglogN) 条 弦 ， 是 使 引 理 11.9 中 的 求 和 为 几 
何 级 数 的 必要 条 件 。 


U3 
© 
下 


11.3 节 
11.3 进行 比赛 的 算法 的 时 间 复 杂 度 是 多 少 (11.3.2 小 节 ) ? 39 


ws 





第 12 章 网 络 中 的 同步 


本 章 研究 分 布 式 计 算 的 理论 是 如 何 受到 假设 影响 的 。 假 设 存 在 进程 可 以 访问 的 全 局 时 间 。 
全 局 时 间 帧 是 我 们 周围 物理 现实 的 一 部 分 ， 这 个 现实 包括 分 布 式 系 统 的 进程 ， 而 且 分 布 式 算 
法 的 设计 会 得 益 于 对 时 间 的 充分 利用 。 本 章 结果 表明 ， 如 果 处 理 时 间 和 通信 时 间 有 界 ， 就 可 
以 充分 利用 时 间 来 减少 分 布 式 算法 的 通信 复杂 度 。 

然而 ， 不 利用 时 间 就 不 可 解 的 问题 ， 在 引入 时 间 后 ， 仍 然 是 不 可 解 的 。 因 此 ， 引 入 同步 
机 制 改进 了 复杂 度 ， 但 是 不 能 提高 分 布 式 系统 的 计算 能 力 。 这 种 情况 与 遭受 故障 的 网 络 中 的 
同步 机 制 影响 不 同 。 在 第 14 章 和 第 15 章 中 ， 可 以 看 到 ， 如 果 充 分 利用 同步 机 制 ， 就 可 以 确定 
处 理 许多 类 故障 。 在 3.2 节 中 已 经 利用 同步 机 制 来 克服 转移 故障 。 

本 章 主要 研究 理想 的 情况 下 的 全 局 时 间 问 题 ， 即 ， 整 个 网 络 按照 离散 步 允 操 作 。 每 一 步 
又 称 为 脉冲 《pulse )， 在 12.1.1 小 节 中 会 进行 解释 。 在 每 个 脉冲 中 ， 每 个 进程 进行 局 部 计算 ， 
并 保证 在 一 个 脉冲 中 发 送 的 消息 在 下 一 个 脉冲 之 前 被 接收 到 。 这 个 全 局 同步 操作 也 称 为 锁 步 
(lockstep) 操作 。 如 果 时 钟 可 用 ， 并 且 假 设 转 移 延迟 有 上 界 ， 锁 步 操 作 的 实现 相当 容易 。 参 
见 12.1.3 小 节 。 

锁 步 中 的 网 络 操作 通常 被 当 作 同步 网 络 (synchronous network )。 同 步 网 络 一 定 不 能 与 
2.1.3 节 所 定义 的 同步 传递 消息 的 网 络 相 混 底 。 在 后 者 中 没有 全 局 同步 机 制 。 仅 当 两 个 进程 通 
信 时 ， 它 们 才 在 消息 交换 中 暂时 同步 ， 但 并 不 与 所 有 进程 同步 ， 消 息 交 换 之 后 ， 同 步 很 快 就 
被 打破 。 

全 局 同步 的 网 络 在 解决 分 布 式 问题 时 ， 比 完全 异步 的 网 络 通信 有 量 小 。 可 以 用 同步 算法 

(对 于 选举 问题 ) 证 明 这 一 点 ， 对 于 同一 问题 ， 同 步 算法 具有 比 异 步 算法 更 低 的 复杂 度 。 参 见 
12.2 节 。 我 们 用 所 谓 的 同步 器 (synchronizer) 算法 证 明 ， 同步 算法 不 能 比 异 步 算法 解决 更 多 
的 问题 。 利 用 同步 器 算法 ， 异 步 网 络 可 以 模拟 同步 网 络 。 参 见 12.3 节 。 
”在 同步 网 络 上 ， 进 行 分 布 式 算法 的 设计 常常 要 容易 些 。 因 为 不 需 考虑 太 多 的 非 -确定 性 。 
对 于 异步 算法 的 设计 ， 我 们 可 以 首先 给 出 它 的 同步 算法 ， 然 后 将 它 与 12.3 节 的 模拟 技术 结合 
起 来 ， 产生 异步 算法 。 尽 管 引 入 同 步 器 会 带 来 一 些 开销 ， 所 得 算法 仍然 优 于 直接 为 异步 网 络 
所 设计 的 算法 。 作 为 同步 器 的 应 用 例子 ， 广 度 优先 搜索 树 的 构造 将 在 12.4 节 进行 考虑 。 

即使 时 钟 不 可 用 ， 做 一 些 弱 的 定时 假设 也 是 合理 的 。 例 如 ， 假 设 系统 中 最 快 的 和 最 慢 的 
组 件 的 执行 速度 之 间 的 比率 是 有 界 的 。 这 个 假设 被 称 为 Archimedean 假 设 [Vit85]。 在 12.5 节 作 
了 简要 讨论 。 已 经 证 明 ， 由 于 几 种 原因 ， 一 般 来 说 ， 完 全 依赖 异步 算法 而 不 利用 定时 假设 会 
更 好 。 在 Archimedean 框 架 下 ， 所 设计 的 算法 ， 它 们 的 正确 性 不 依赖 于 定时 假设 ， 而 它们 的 复 
杂 度 却 得 益 于 这 些 假设 。 


12.1 预备 知识 
12.1.1 同步 网 络 
在 同步 的 分 布 式 系统 中 ， 每 个 进程 的 操作 发 生 在 一 个 离散 步 的 序列 (可 能 无 限 ) 中 。 这 
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个 序列 中 的 每 一 步 称 为 脉冲 (pulse)。 在 一 个 脉冲 中 ， 进 程 首先 发 送 ( 零 或 者 多 个 ) 消息 ， 然 
后 接收 ( 零 或 者 多 个 ) 消息 ， 最 后 进行 局 部 计算 (改变 状态 )。 消 息 的 接收 与 发 送 在 同一 脉冲 
中 ， 即 如 果 p 在 第 i 个 脉冲 向 gq 发送 一 条 消息 ， 那 么 g 在 它 的 第 ;个 脉冲 接收 这 个 消息 ， 且 4 的 接收 
在 那个 脉冲 中 4q 的 计算 开始 之 前 发 生 。 

可 以 把 脉冲 数 看 作 全 局 时 钟 的 滴答 (“脉冲”) 数 。 计 算 在 时 钟 脉冲 中 进行 ， 在 一 个 脉冲 
中 发 送 的 消息 保证 在 下 一 个 脉冲 开始 之 前 接收 到 。 系 统 在 第 ;个 脉冲 之 后 的 配置 ， 定 义 为 第 ;个 
脉冲 之 后 每 个 进程 状态 组 成 的 元 组 。 

为 了 形式 地 定义 同步 系统 ， 如 第 2 章 , 设 M 表 示 消 息 的 集合 ， PA 表示 消息 多 集 的 集合 。 
在 同步 系统 中 ， 进 程 的 定义 与 异步 系统 中 进程 的 定义 不 同 ， 因 为 在 系统 的 一 次 转移 中 就 可 进 
行 消息 集 的 接收 和 发 送 。 为 了 避免 混淆 ， 我 们 称 同步 系统 的 进程 为 同步 进程 (synchronous 
process). 

定义 12.1 同步 进程 是 4- 元 组 p= (Z, 1, MG, H) RY 

(1) Z 是 状态 集合 ， 

(2) /是 初始 状态 集 ，Z 的 子 集 。 

(3) MG: Z 一 PAM 是 消息 生成 函数 ， 且 

(4) 上 是 Zx PM xZ 上 的 关系 。 我 们 用 (c, M) 上 d 表 示 〈c， M, d) EF. 

进程 在 状态 co E 7 开始 它 的 计算 。 当 进程 在 状态 c < Z 开 始 一 个 脉冲 时 ， 它 就 发 送 消息 
集 MG(c)。 在 下 一 个 脉 剖 之前， 它 接收 到 在 这 个 脉冲 中 发 送 给 它 的 消息 集 ， 如 ，M， 并 进 
入 状态 4d, 满足 (c, M) kd. 

在 这 种 定义 之 下 ， 进 程 发 送 的 消息 集 完全 由 脉冲 开始 时 的 状态 决定 。 进 程 的 所 有 内 部 非 - 
确定 性 都 在 关系 上 中 。 非 确定 性 也 可 能 在 MG 中 (此 时 ，M 9G 是 关系 而 不 是 函数 )。 但 是 非 
确定 性 选择 在 关系 + 中 ， 同 样 能 够 被 很 好 地 模型 化 。 

同步 系统 是 同步 进程 的 集合 P。 同 步 系 统 的 配置 是 由 每 个 进程 的 状态 组 成 的 元 组 。 初 始 本 
置 是 这 样 一 种 配置 ， 其 中 每 个 进程 都 处 于 初始 状态 。 所 有 进程 的 状态 改变 同步 于 系统 的 一 次 
全 局 转移 ， 其 中 每 个 进程 状态 的 改变 受到 在 当前 配置 中 发 送 给 它 的 消息 集 的 影响 。 

定义 12.2 由 (AP) 进程 组 成 的 同步 系统 P = (di, ..., pw) (其 中 pp 是 进程 (Z, 
L, M9,, F:)) 是 一 个 转移 系统 5S = (C, > ,Z), 其 中 

(1) C={ (ci1, C2, ..., Cw): Wi, ci EZ}, 

(2) 如 果 对 于 每 个 p; EP; (c, mE ( Upew AMGj(c)):m 的 目的 节点 为 pi;}) Fidi; 
一 是 由 〈cl，…，cw) > (di, ..., dy) 所 定义 的 关系 ， 

(3) T ={ (ey, €2, «5 ey): Wi, ci El}, i 

系统 的 同步 计算 是 配置 的 最 大 序列 ip，y;，…， 满 足 h 是 初始 配置 ， 对 于 所 有 i > 0， yi 一 
Ym。 这 个 计算 的 消息 复杂 度 就 是 所 交换 的 消息 数 ， 时 间 复 杂 度 等 于 最 后 配置 的 下 标 ( 假 设计 
算是 有 限 的 )。 


12.1.2 通过 同步 提高 效率 


在 需要 的 地 方 ， 我 们 将 在 本 章 的 算法 中 隐 含 地 假设 ， 进 程 状态 中 包含 一 个 脉冲 计数 器 ， 
用 以 标明 进程 执行 的 脉冲 数 。 本 小 节 中 ， 我 们 将 讨论 许多 范 型 ， 这 些 范 型 可 用 于 同步 网 络 ， 
目的 是 降低 分 布 式 算法 的 通信 复杂 度 。 
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1. 按照 时 间 编 码 

只 用 两 位 来 发 送 任意 消息 ， 可 以 节省 大 量 位 交换 数 。 为 此 ， 必 须 对 消息 的 内 容 按照 两 位 
发 送 之 间 的 时 间 (脉冲 数 )“ 编 码 ”。 

假设 进程 p 必 须 向 进程 q 发 送 消 息 。 假 设 消息 的 内 容 可 表示 为 整数 nm。 为 了 传输 值 m， 需 要 
利用 两 条 消息 <start> 和 <stop>。 进 程 p 在 脉冲 i 中 发 送 <start> 消 息 ， 该 脉冲 也 就 是 传输 开始 时 
的 脉冲 ， 在 脉冲 i+ m 中 发 送 <stop> 消 息 。 进 程 q 在 脉冲 4 和 5 分 别 接收 消息 <start> 和 <stop>， 并 
在 脉冲 b 接 收 消 息 b-a。 按 照 时 间 编 码 方法 致使 消息 传输 很 耗 时 。g 接 到 消息 m 的 脉冲 要 比 进程 p 
初始 化 传输 的 脉冲 有 晚 。 可 以 发 送 更 多 的 位 ， 来 减少 消息 传输 对 时 间 的 消耗 。 参 见习 题 12.1。 

2. 隐 式 消息 

在 异步 系统 中 ， 仅 当 进 程 接 到 来 自 近邻 的 消息 时 ， 才 可 以 获得 来 自 这 个 近邻 的 信息 。 在 
同步 系统 中 ， 如 果 进 程 在 某 些 脉 冲 内 没有 接 到 从 已 知 近邻 而 来 的 消息 ， 那 么 这 个 近邻 在 这 个 
脉冲 内 就 不 会 发 送 消 息 ， 表 明 进 程 已 经 获得 关于 其 近邻 的 状态 的 信息 。 

例如 ， 考 虑 计算 所 有 点 对 之 间 最 短路 径 问题 的 Toueg 算 法 (图 4-6 所 示 的 算法 )， 在 计算 枢 
轴 元 素 w 的 这 一 枢 轴 轮 中 ， 每 个 进程 必须 知道 它 的 哪些 近邻 是 它 在 树 T, 中 的 子 节 点 ， 为 此 ， 经 
过 每 个 信道 经 交换 消息 <ys，w> 或 者 消息 <nys，w>。 在 同步 网 络 中 ， 只 需 发 送 消息 <ys，w>。 
如 果 不 能 从 一 个 近邻 接收 到 这 样 的 消息 (在 发 生 这 些 消息 交换 的 脉冲 中 )， 那 么 这 个 近邻 就 不 
是 子 节 点 。 生 成 消息 <nys，w> 隐 含 着 减少 计算 每 个 进程 子 节 点 的 复杂 度 ， 从 21EI 降 到 至 多 N-1 
条 消息 。( 在 异步 系统 中 ， 同 样 可 以 避免 发 送 消息 <nys，w> ， 但 却 以 设计 更 复杂 算法 和 增加 
空间 复杂 度 为 代价 。) 

3. 选择 性 延迟 

我 们 已 经 碰 到 一 些 开始 几 个 子 计 算 的 分 布 式 算法 ， 其 中 一 个 子 计 算 保 证 产生 所 需 的 结果 ， 
而 所 有 其 他 的 子 计 算 的 结果 被 忽略 。 这 类 算法 的 例子 包括 把 废止 原理 (7.3.1 小 节 ) 应 用 到 集 
中 式 的 波动 算法 ， 所 获得 的 选举 算法 。 

为 了 减少 消息 复杂 度 ， 可 以 用 不 同 条 件 减 慢 每 个 特定 的 子 计算 。 在 异步 情况 下 ， 这 是 不 
可 避免 的 〈 至 少 在 最 坏 情形 下 ) ， 不 成 功 的 子 计算 运行 到 完成 ， 使 得 通信 复杂 度 为 子 计 算数 与 
每 个 子 计算 的 计算 复杂 度 的 乘积 。 在 同步 情况 下 ， 用 成 功 子 计算 的 完成 时 间 除 以 本 次 计算 的 
减 慢 因子 所 得 的 值 对 不 成 功 子 计算 所 需 的 步 数 做 了 界定 。 在 12.2.2 小 节 ， 分 析 了 由 仔细 选择 的 
减 慢 因子 所 造成 的 选择 性 延迟 。 


12.1.3 异步 有 限 延 迟 网 络 


同步 网 络 所 基于 的 假设 是 一 个 很 强 的 假设 ， 即 所 有 进程 状态 的 改变 是 全 局 同步 的 。 更 适 
度 的 假设 是 每 个 进程 都 有 一 个 物理 时 钟 (不 必 同 步 )， 且 消息 传输 时 间 有 上 界 。 这 一 模型 在 
3.2 节 中 使 用 过 ， 在 Chou 等 人 [CCGZ90] 之 后 ， 这 类 网 络 被 称 之 为 异步 有 限 - 延 迟 网 络 
(asynchronous bounded-delay network ) 或 者 简称 为 ABD 网 络 。 

定义 12.3 并 步 有 限 - 廷 迟 网 络 是 分 布 式 系统 ， 在 这 个 系统 中 ， 以 下 假设 成 主 。 

(1) 在 一 个 进程 内 执行 一 个 事件 需要 0 个 时 间 单 位 。 

(2) 每 个 进程 有 一 个 时 钟 ， 用 于 测量 物理 时 间 ; 如 有 果 CLOCKo0O 表 示 户 的 时 钟 在 ! 时 刻 的 值 ， 
HA fit Fot,z i, PHASE HH PR, ABZ 


CLOCK,” - CLOCK” =t, -1, 
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(3) 消息 发 送 和 接收 之 间 的 物理 时 间 被 界定 为 KW。 即 ， 如 果 消 息 在 时 间 a 发 送 ， 在 时 间接 
uk, 那么 ， 


O<T<O+U 


在 ABD 网 络 上 实现 同步 网 络 并 不 难 ， 因 为 所 需要 的 消息 和 时 间 开 销 较 小 。 实 现 同 步 网 络 
的 机 制 称 为 同步 器 (synchronizer)， 匈 12.3 节 。 在 设计 同步 器 时 遇 到 的 主要 困难 是 要 保证 进程 
在 改变 状态 并 开始 脉冲 ; +1 之 前 ， 接 收 到 脉冲 ;的 所 有 消息 。 

1. ABD 同 步 器 

ABD 网 络 同步 器 的 主要 原理 是 进程 的 时 钟 尽 可 能 精确 同步 ， 如 ， 具 有 精度 5， 每 个 进程 在 
其 时 钟 5 + HA 个 时 间 单 位 后 才 执 行 下 一 个 脉冲 。15.3 节 讨论 了 时 钟 同步 算法 。 我 们 现在 给 出 Tel 
等 人 [TKZ94] 提 出 的 一 些 基 本 算法 。 

Tel 等 人 提出 的 ABD 同 步 器 ， 由 时 钟 - 同 步 (clock-synchronization phase) 阶段 和 模拟 
(simulation phase) 阶段 两 部 分 组 成 ， 作 为 图 12-1 所 示 的 算法 中 给 出 。 在 时 钟 同步 阶段 中 ， 每 
个 进程 将 它 的 时 钟 重新 设置 为 0， 并 向 它 的 每 个 近邻 发 送 消息 <start>。 由 ABD 网 络 所 基于 的 
假设 ， 重 新 设置 时 钟 和 发 送 消息 <start> 需 要 的 时 间 为 0。 进 程 执 行 这 些 步 ， 或 者 来 初始 化 同步 
算法 〈 自 然 地 )， 或 者 在 接 到 第 一 条 消息 <start> 的 时 候 。 作 为 同步 阶段 的 结果 ， 近 邻 进程 的 时 
钟 以 精度 4 同步 。 


var CLOCK, : clock; 
statep : Zp; 
pulse, : integer ; 


procedure init: (* Can be executed spontaneously *) 
begin if not started, then 
begin CLOCK, :=0; 
forall q € Neigh, do send (start) to q 


end 


Ip: {A (start) message has arrived at p } 
begin receive {start ) ; init end 


Po). The start of the ith pulse at p } 
when CLOCK, = 2ip do 
begin (* End previous pulse, compute state@-)) *) 
ifi=1 
then state, := initial state 
else (* M is the collection of (i — 1)-messages received *) 
statep := dp satisfying (statep, M) + dp ; 
pulse, := i ; 
(* send the messages of pulse i *) 
M = MG(state,) ; send all messages of M’ 
end 


Mp: { A basic i-message has arrived *) 
begin receive and store the message end 





图 12-1 ABD 同 步 器 算法 
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定理 12.4 近邻 p 和 9 执行 初始 化 过 程 训 让 后 ， 在 每 个 时 间 !，P 和 9 的 时 钟 满足 
1CLOCKO - CLOCK? K p 


证 明 。 设 w, (或 w,) 表示 p( 或 9) 执行 过 程 init 的 时 刻 。 当 p 在 时 间 w, 向 gq 发 送 消 息 <start>， 
gq 在 接 到 消息 <start> 的 最 近 时 刻 执行 jnit，we < ws + 4。 反 之 ，wp < ws + K， 由 此 可 得 | w, — w | 
< 4。 因 为 p 和 4 在 执行 init 之 后 ， 并 没有 对 时 钟 赋值 ， 对 于 + > max (wp, w,), WA 


ICLOCK® - CLOCK | 
=|[CLOCK\"” +(t-w,)]-[CLOCK,"” +(t-w,)]| 
=I[0+(t-w,)]-[0 +t- w, II 


=lw,-w,l<u 














在 模拟 阶段 中 ， 进 程 执行 同步 算法 指定 的 脉冲 (状态 改变 )。 同 步 算 法 在 脉冲 i 中 所 交换 的 
消息 ， 称 为 -消息 。 利 用 到 目前 为 止 接 到 的 (i-1)- 消 息 ， 改 变 状 态 后 ， 当 局 部 时 钟 读数 为 2in 
有 时， 开始 执行 第 个 脉冲 。 近 似 同 步 以 及 消息 延迟 的 上 界 表明 ， 一 个 脉冲 中 的 所 有 消息 在 进程 (401 
开始 下 一 个 脉冲 之 前 已 经 到 达 进程 ， 并 且 系 统 的 行为 就 像 是 一 个 同步 系统 。 设 state 表示 第 [402 
i+1 个 状态 改变 后 进程 P 的 状态 ， 即 第 (+1) 个 脉冲 开始 后 的 状态 iy RTA 
( state, „staten )。 读 者 应 该 注意 到 ， 这 个 元 组 不 必 作为 ABD 网 络 的 一 个 配置 出 现 。 因 为 它 
可 能 就 是 这 样 一 种 情况 ， 即 ， 进 程 从 来 不 会 同时 出 现在 这 些 状 态 中 。 
定理 12.5 序列 C= (yw, n, ..) 是 同步 算法 的 一 次 计算 。 
WA. HAVIAR, EA (Yo ys -o y) 是 计算 的 前 级 。 对 于 i = 0， 观 察 可 见 ， 
nn 是 同步 算法 的 初始 配置 ， 因 为 对 于 每 个 p， state "是 同步 算法 中 p 的 初始 状态 。 
假设 (yo. yo -o %) 是 同步 算法 计算 的 前 级 。 进 程 p 利 用 到 目前 为 止 接 收 的 (i+1)- 消 
息 的 集合 M,”， 当 它 的 时 钟 读数 为 2(i+2)k 时 ， 进 程 p 结 束 第 i+1 个 脉冲 ， 并 将 它 的 状态 变 为 
states”。 为 了 证 明 由 《( state’*,...,state*”) 定义 的 配置 扩展 了 计算 ， 只 要 证 明 ， MEF 
在 第 计 1 个 脉冲 发 送 绘 P 的 消息 集合 就 足够 了 。 
假设 4 在 第 计 1 个 脉冲 发 送 给 p 一 条 消息 ， 即 ， 当 4 的 时 钟 读数 为 2( 计 1) Ap 时 。 设 o 是 这 个 消 
息 被 发 送 时 的 〈 全 局 ) 时 间 ，t 是 p 接 收 这 个 消息 的 (全 局 ) 时 间 。 由 于 CLOCK) = 206+DA 和 
9 是 p 的 近邻 ，CLOCKo”<2(i+ Du+ 4 (由 定理 12.4)。 因 为 r-o <u, CLOCK” <Xi+lju+u 
+ 人 =2(i+2)n， 即 p 在 结束 第 i +1 个 脉冲 之 前 接收 消息 。 口 
进程 也 可 能 在 开始 自身 的 脉冲 之 前 ， 接 收 脉 冲 的 一 条 消息 。 然 后 存储 此 消息 ， 仅 在 下 次 
脉冲 中 处 理 该 消息 。 对 于 每 条 所 接收 的 消息 ， 进 程 可 能 要 决定 在 哪 一 个 脉冲 中 处 理 该 消息 。 
如 果 模 2 的 脉冲 数 随 着 每 条 消息 发 送 ， 是 可 能 出 现 这 种 情况 的 。 参 见习 题 12.3。 如 果 每 个 进程 
能 把 接收 每 一 近邻 的 消息 <start> 时 的 时 钟 时 间 存 储 起 来 ， 就 不 需要 附加 信息 。 参 见习 题 12.4 
或 者 [TK294]。 
2. 同步 复杂 度 
间 步 机 制 的 复杂 度 可 用 通信 和 时 间 来 度量 ， 同 时 还 要 考虑 同步 器 的 初始 化 和 每 个 模拟 脉 
冲 的 开销 ， 参 见 12.3 节 。 
初始 化 阶段 要 求 交 换 21El 条 消息 ,需要 O(D) 时 间 单位 。 模 拟 阶 段 不 需要 附加 信息 (仅仅 
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是 模拟 的 同步 算法 的 消息 被 发 送 )。 进 程 每 24 个 时 间 单 位 完成 一 次 脉 串 。 脉 冲 之 间 的 时 间 称 为 
脉冲 时 间 。 

Tel 等 人 [TKZ94] 研 究 了 ABD 网 络 的 所 有 同步 器 的 类 别 ， 这 些 网 络 在 初始 化 阶段 利用 21BI 条 
消息 ， 在 模拟 过 程 中 不 需要 附加 消息 。 他 们 已 经 证 明 ， 对 于 任意 网 、 环 网 和 超 立 方 体 ， 脉冲 
时 间 24 是 最 优 的 。 星 型 网 的 脉冲 时 间 为 (3/2)k， 团 网 的 脉冲 时 间 为 (2-UN)hn。 所 有 这 些 脉 
钟 时 间 都 是 最 优 的 。 

3. 时 钟 漂移 和 不 可 忽略 的 处 理 时 间 

为 了 在 实际 情况 下 利用 ABD 网 络 的 结果 ， 必 须 放宽 定义 12.3 中 的 假设 。 在 实际 中 ， 处 理 
器 的 时 钟 会 有 漂移 ， 处 理 一 条 消息 的 时 间 不 为 0。 

在 模拟 阶段 中 ， 我 们 可 以 通过 逐步 增加 脉冲 时 间 来 处 理 时 钟 漂移 问题 以 补偿 近邻 进程 的 
时 钟 读 取 之 间 可 能 不 断 增 加 的 差别 。 如 果 脉 冲 时 间 因此 变 得 太 大 (在 模拟 多 个 脉冲 之 后 )， 在 
一 个 预先 确定 的 脉冲 数 之 后 ， 有 可 能 重新 执行 同步 阶段 。 参 见 [Tel91b， 第 2 章 ]。 

如 果 处 理 一 个 脉冲 的 消息 以 及 开始 下 一 个 脉冲 所 需 的 时 间 是 不 可 忽略 的 ， 但 又 是 由 zx 界定 
的 ， 那 么 可 以 通过 将 脉冲 时 间 增 加 z， 来 轻易 地 修改 同步 器 。 


12.2 同步 网 络 中 的 选举 


本 节目 标 是 证 明 ， 对 于 某 些 特定 问题 的 解决 方法 ， 同 步 网 络 严格 意义 上 比 异 步 网 络 要 求 
更 小 的 消息 复杂 度 。 在 第 7 章 中 ,证 明了 异步 网 络 中 选举 领导 人 所 需 交 换 的 消息 数 的 下 界 。 本 
节 给 出 的 同步 算 靶 ， 其 消息 复杂 度 比 这 些 下 界 要 低 。 时 间 复 杂 度 〈( 即 ， 选 举 领导 人 的 脉冲 的 
数目 ) 主要 取决 于 网 络 大 小 是 否 已 知 。 

算法 假设 进程 标识 是 不 同 的 整数 ， 如 果 这 些 标识 取 自 任意 可 数 集合 ， 那 么 利用 对 这 个 集 
合 的 固定 的 枚 举 ， 就 可 以 把 它们 转换 成 整数 。 同 时 还 假设 ， 算 法 的 所 有 初始 进程 在 同一 脉冲 
(脉冲 0) 开始 选举 。 初 始 进程 不 必 在 同一 个 脉冲 中 开始 的 情形 ， 将 在 12.2.3 小 节 中 简要 讨论 ， 


12.2.1 网 络 规模 已 知 


本 小 节 考 虑 的 算法 需要 关于 网 络 直径 上 界 D 的 知识 。 WRCR, WAEN- LAE 
作为 直径 的 上 界 。 

1. 算法 \ 

进程 p 通 过 将 消息 发 送 到 它 的 每 一 个 近邻 中 ， 而 将 消息 扩散 ， 在 这 之 后 ， 除了 进程 p 之 外 ， 
第 一 次 接 到 消息 的 每 个 进程 在 下 一 个 脉冲 中 ， 将 接收 到 的 消息 发 送 到 它 的 每 个 近邻 中 。 按 照 
这 种 方 靶 ， 扩 散 一 条 消息 需要 215I 条 消息 的 代价 ， 且 如 果 进 程 在 脉冲 zz， 初始 化 消息 的 扩散 过 
程 ， 那 么 每 个 进程 最 迟 在 脉冲 jz + (D-1) 接收 到 这 条 消息 。 这 蕴含 着 ， 如 果 一 个 进程 在 脉冲 
i+(D-1) 或 更 早 一 些 还 没有 接 到 扩散 的 消息 ， 那么 在 脉冲 i 或 者 更 早 一 些 的 脉冲 ， 没 有 进程 
已 经 初始 化 了 扩散 过 程 。 

在 选举 算法 中 ， 只 有 一 条 消息 被 具有 最 小 标识 的 进程 po 进行 扩散 ， 在 脉冲 poD 中 初始 化 这 
一 扩散 过 程 。 如 果 进 程 Po 在 脉冲 poD-1 或 者 之 前 还 没有 接 到 扩散 的 消息 ， 那么 它 知道 没有 进程 
的 标识 比 它 更 小 。 不 初始 化 消息 扩散 过 程 ， 所 有 进程 ， 维 含 着 已 经 扩散 了 这 样 一 条 消息 “我 
的 标识 超过 po-1 ”。 

总 之 ， 进 程 p 等 待 ， 直 至 或 者 一 条 消息 到 达 ， 或 者 在 p 接 到 消息 之 前 ， 脉 冲 数 达 到 pD。 在 





PIÈ ABPHYG 255 


后 一 种 情况 下 ， 进 程 p 初 始 化 消息 扩散 过 程 ， 并 成 为 领导 人 。 算 法 首先 由 Santoro 和 Rotem 
[SR85] 提 出 。 消 息 复杂 度 为 O(IEI)， 时 间 复 杂 度 为 pspD +(D-1)， 其 中 po 是 进程 的 最 小 标识 
观察 可 见 ， 时 间 复 杂 度 并 不 限定 为 N 的 函数 。 

2. 扩展 和 变化 

可 以 容易 地 扩展 算法 来 计算 以 领导 人 为 根 的 一 棵 生成 树 。 每 个 进程 选择 在 最 早 脉 冲 中 接 
到 消息 的 一 个 进程 作为 它 的 父 节点 。 

由 于 消息 中 不 需要 进行 信息 的 交换 ， 这 些 算 法 的 位 复杂 度 等 于 它们 的 消息 复杂 度 。 

如 果 拓 扑 知 识 可 用 ， 就 可 以 更 有 效 地 进行 扩散 过 程 。 当 然 ， 如 果 拓 扑 结 构 任 意 和 未 知 ， 
那么 通过 每 个 信道 至 少 要 发 送 一 条 消息 ， 类 似 于 定理 7.15 中 的 所 使 用 的 论证 。 如 果 拓 扑 结构 
已 知 为 团 、 圆 环 或 者 超 立 方 体 ， 利 用 更 有 效 的 扩散 算法 可 以 减少 消息 数 ， 参 见习 题 12.6。 

Van Leeuwen 等 人 [LSUZ87] 已 经 证 明 ， 可 以 通过 交换 更 多 消息 ， 减 少时 间 复 杂 度 。 进 行 K 
次 扩散 过 程 〈 使 消息 复杂 度 达到 OU E), EOC py*D ) 个 脉冲 内 就 可 以 找到 最 小 标识 


12.2.2 网 络 规模 未 知 


在 网 络 大 小 和 直径 未 知 时 ， 利 用 选择 性 延迟 ， 把 废止 技术 应 用 在 遍历 算法 中 (7.3.1 小 菠 )， 
可 得 到 有 效 的 选举 算法 。 

如 果 进 程 p 是 选举 算法 的 初始 进程 ，P 初 始 化 遍历 算法 ， 且 使 令 牌 的 标号 为 p。 按 照 遍历 算 
法 转发 令 牌 ， 直 到 令 牌 被 一 个 进程 清除 ， 该 进程 已 经 看 到 一 个 更 小 标识 ， 或 者 在 进程 p 中 终止 
它 的 遍历 。 如 果 出 现 后 一 种 情况 ，p 成 为 领导 人 。 在 每 次 跳跃 中 ， 初 始 进 程 p 的 令 牌 被 延迟 27 
个 脉冲 ， 即 ， 如 果 进 程 在 脉冲 :接收 到 p 的 令 牌 ， 它 就 在 脉冲 i + 27 转 发 该 令 牌 。 

所 得 算法 的 正确 性 证 明 类 似 于 定理 7.17。 设 po 是 具有 最 小 标识 的 初始 进程 ， 进 程 po 楼 收 到 
返回 的 令 牌 后 ， 则 被 选中 。 不 存在 其 他 初始 进程 的 令 牌 终止 这 个 遍历 ， 因 为 它 已 经 被 po 或 者 
只 一 个 初始 进程 清除 。 

接 下 来 要 证 明 ， 选 择 性 延迟 是 如 何 把 消息 复杂 度 限制 到 O (W) 的 ， 其 中 W 是 遍历 算法 的 
复杂 度 。 进 程 po 在 2%W 个 脉冲 后 被 选 ， 因 为 令 牌 进行 W 次 跳跃 ， 每 次 哆 跃 需要 花费 220 个 脉冲 。 
在 2%W 个 脉冲 后 ， 每 个 进程 已 经 看 到 标识 p。， 因 此 在 那个 脉冲 或 者 其 后 的 脉冲 ， 不 会 转发 其 
他 的 令 牌 。 初 始 进程 p + po 的 令 牌 至 多 被 转发 (2roW)/2? 次 ， 因 为 它 在 27oW 脉 冲 后 不 再 转发 这 
些 令 牌 ,在 脉冲 P 之 前 ， 至 多 被 转发 P/2r 次 。 设 5 表示 初始 进程 的 集合 。 传 递 的 消息 总 数 界限 
为 W (po 的 令 牌 的 跳 数 ) 加 上 除 po 的 令 牌 以 外 的 令 牌 的 跳 数 : 

复杂 度 = We P (P 的 令 牌 跳 数 ) 
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消息 的 内 容 可 按时 间 编 码 ， 可 用 两 条 消息 传输 每 个 令 牌 ， 每 条 消息 占 一 位 。 这 就 证 明了 
选举 算法 的 位 复杂 度 为 O(W)。 在 这 种 情况 下 ， 按时 间 编 码 并 不 会 进一步 增加 时 间 复 杂 度 。 因 
为 令 牌 在 每 个 节点 上 所 遭受 到 的 延迟 超过 了 它 的 传输 所 需 的 时 间 。 算法 的 时 间 复 杂 度 也 不 是 N 
的 函数 ， 而 是 进程 的 最 小 标识 po 的 指数 (exponential) 函数 。 
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12.2.3 补充 结果 


1. 比较 算法 

本 节 中 描述 的 算法 不 是 比较 算法 。 在 比较 算法 中 ， 对 进程 标识 允许 的 惟一 操作 是 比较 。 
直到 依赖 标识 的 值 到 达 ， 才 能 对 脉冲 计数 。 

Frederickson 和 Lynch[FL84] 已 经 证 明 ， 在 同步 环 上 ， 选举 的 比较 算法 至 少 交 换 Q(N log N) 
条 消息 。 即 ， 异 步 算法 的 下 界 对 于 同步 比较 算法 成 立 。 同 时 ，Frederickson 和 Lynch 证 明 ， 如 
果 时 间 复 杂 度 为 N 的 函数 ， 可 能 的 标识 的 集合 大 小 不 限 ， 每 个 算法 的 行为 就 像 是 最 坏 情况 下 的 
比较 算法 ， 这 蕴含 着 消息 复杂 度 至 少 为 Q(N log N). 

这 表明 消息 复杂 度 的 降低 ， 是 以 将 时 间 复 杂 度 增加 到 一 个 不 是 N 的 函数 的 值 为 代价 。 对 于 
网 络 大 小 未 知 ，、 是 否 存 在 同步 选举 算法 ， 具有 上 述 给 定 算法 的 消息 复杂 度 ， 且 时 间 复 杂 度 为 
最 小 标识 的 多 项 式 〈polynomial) 函数 ， 还 仍 是 一 个 尚 待 解决 的 问题 。 

2. 不 同时 开始 

如 果 不 假设 (如 我 们 隐 仿 地 所 做 的 ) 每 个 进程 同时 初始 化 算法 (所 有 进程 在 脉冲 0 开始 计 
数 )， 选 举 问 题 就 会 变 得 更 难 一 些 。 通 过 扩散 唤醒 消息 ， 当 某 些 进程 开始 时 ， 能 够 保证 所 有 初 
始 进程 在 个 脉冲 之 内 开始 执行 算法 ， 对 于 本 节 的 算法 (改编 版 ) 就 足够 了 。 然 而 ， 扩 散 消息 
的 代价 为 O(IEI1)。 

3. 团 上 的 选举 

利用 本 节 的 算法 ， 在 团 上 选举 领导 人 的 消息 复杂 度 为 O(N)。 然 而 ， 这 些 算法 要 求 ， 所 有 
进程 在 同一 个 脉冲 开始 执行 算法 。 增 加 一 个 初始 化 阶段 ， 在 该 阶段 中 扩散 一 条 唤醒 消息 ， 使 
消息 复杂 度 增加 了 2IEI， 达 到 @(N)。Afek 和 Gafni[AG91] 分 析 了 全 上 选举 算法 的 复杂 度 ， 证 
明 如 果 不 假设 同时 开始 ， 需 要 的 消息 数 为 B(N log N)， 并 且 这 是 一 个 充分 条 件 。 他 们 提出 了 
消息 复杂 度 为 8(N log N)、 时 间 复 杂 度 为 O(log N) 的 算法 。 


12.3 同步 器 算法 


本 市 考虑 完全 异步 网 络 上 的 几 个 同步 器 算法 。 这 些 同步 器 算法 的 复杂 度 由 以 下 4 个 参数 度量 。 

Mint， 初 始 化 阶段 的 消息 复杂 度 。 

Tim， 初 始 化 阶段 的 时 间 复 杂 度 。 

Mopuse， 模 拟 每 个 脉冲 的 消息 复杂 度 。 

Tpuse， 模 拟 每 个 脉冲 的 时 间 复 杂 度 。 

当 进 程 发 送 某 次 脉冲 的 消息 时 ， 称 它 模拟 那 次 脉冲 。 可 用 任何 进程 的 第 一 步 和 第 一 次 脉 
冲 的 最 后 一 次 模拟 之 间 的 最 大 时 间 ， 度 量 初始 化 阶段 的 时 间 复 杂 度 。 一 次 脉冲 的 时 间 复 杂 度 
定义 为 一 次 脉冲 的 最 后 一 次 模拟 和 下 一 次 脉冲 的 最 后 一 次 模拟 之 间 的 最 大 时 间 。 在 这 两 种 情 
况 下 ， 时 间 复 杂 度 的 度量 都 是 在 定义 6.31 的 理想 计时 假设 下 进行 的 。 脉冲 的 消息 复杂 度 只 对 
附加 消息 计数 ， 不 对 模拟 算法 中 的 消息 计数 。 

消息 复杂 度 为 M4、 时间 复杂 度 为 7 的 同步 算法 ， 可 用 Mis + M + MopseT 条 消息 、Tw + Tue7 
个 时 间 单 位 模拟 。 表 12-3 给 出 了 本 章 同步 器 算法 的 概览 ，。 


12.3.1 简单 同步 器 
在 本 章 的 所 有 同步 器 中 ， 进 程 保证 当前 脉冲 的 所 有 消息 都 已 被 接收 到 ， 此 时 正 是 所 有 消 
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息 得 到 处 理 ， 下 次 脉冲 开始 的 时 刻 。 在 ABD 同 步 器 中 ， 这 种 保证 基于 时 钟 可 用 性 ， 但 是 对 于 
完全 异步 系统 的 同步 器 ， 就 不 可 能 保证 这 一 点 。 因 为 所 有 蜡 步 算法 可 以 用 消息 驱动 的 形式 写 
出 ， 每 个 进程 必须 接收 一 条 消息 ， 以 触发 下 一 次 脉冲 ， 这 蕴含 着 模拟 每 个 脉冲 至 少 需要 N 条 消 
息 。 l 
在 最 简单 的 同步 器 中 ， 每 个 脉冲 中 的 每 个 进程 只 向 每 个 近邻 发 送 一 条 消息 。 如 果 模 拟 的 
算法 在 基 些 脉冲 中 并 不 发 送 消息 ， 同 步 器 就 会 加 上 一 条 “ 空 ”消息 。 如 果 模 拟 的 算法 发 送 多 
于 一 条 的 消息 ， 这 些 消息 就 会 被 打包 成 同步 器 中 的 一 条 消息 。 每 个 脉冲 中 的 每 个 进程 只 能 接 
收 每 个 近邻 的 一 条 消息 ， 当 接收 到 每 个 近邻 的 脉冲 的 消息 时 ， 开 始 处 理 所 有 消息 ， 然 后 开始 
第 i +1 个 脉冲 ， 参 见 图 12-2 所 示 的 算法 。 一 旦 跟随 者 接 到 第 一 条 消息 ， 初 始 者 自发 地 执行 初始 
化 过 程 。 
var pulse, : integer ; 

statep : Zp; 

waitp . : integer init |Neigh,| ; 

nwait, : integer init |Neigh,| ; 


D 
oO 
oo 


To initiate the algorithm: 
begin (* start first pulse spontaneously *) 
state := initial state ; pulse, := 1 ; 
forall q € Neigh, do 
begin Mp[q] :={m € MGp(statep) : 
m has destination q} ; 
send (pack, Mplg], pulse, ) to q 


end 
end 


{ A message (pack, (m1, ..),i) has arrived } 
begin receive and store message ; 
if i = pulse, then wait, := waity — 1 
else nwait, := nwait, — 1; 
while wait, = 0 do 
begin (* M is the set of received messages of this pulse *) 
statep := dp with (state, M) E- dp ; l 
pulse, := pulse, +i; 
watt, := nwaitp ; nwaitp := | Neigh, | ; 
forall q € Neigh, do 
begin M,[q] :={m € MG,(state,) : 
m has destination q} ; 
send (pack, M,[q], pulse, ) to q 
end 





图 12-2 简单 同步 器 算法 


pulse, = i 的 进程 p 只 能 接收 第 个 脉冲 和 第 i +1 个 脉冲 的 消息 。 早 先 脉冲 的 所 有 消息 已 经 接 
收 到 。 在 p 发 送 它 的 第 i +1 个 脉冲 的 消息 之 前 ， 没 有 它 的 近邻 能 够 发 送 脉冲 数 大 二 ;+1 的 消息 。 
因此 p 只 需 保持 当前 (wait) 脉冲 和 下 一 次 (nwait,) 脉冲 所 期 望 的 消息 数 的 信息 。 因 此 传输 [409] 
脉冲 数 模 2 就 够 了 。 
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初始 化 模拟 过 程 不 需要 附加 消息 。 每 个 进程 或 者 自发 地 ， 或 者 当 接 到 一 条 消息 的 时 候 ， 
才 发 送 初始 脉冲 的 消息 。 当 至 少 有 一 个 进程 开始 模拟 时 ， 所 有 进程 在 DP 个 时 间 单 位 内 都 会 加 入 
模拟 过 程 。 因此 ， Minit = OMT m = D., 

每 个 脉冲 只 需要 交换 2IEI 条 消息 ， 在 最 坯 情况 下 ， 所 有 这 些 消 息 都 是 附加 消息 。 因 此 Mbpuse 
= 2IEl。 如 果 脉 冲 ; 的 最 后 模拟 出 现在 时 间 :， 在 时 间 i +1 收 到 脉冲 的 所 有 消息 。 因 此 ， 脉 冲 i +1 
的 最 后 模拟 最 迟 出 现在 时 间 :+1。 因 此 ,Tuse = 1。 

简单 同步 器 算法 的 应 用 不 需要 领导 人 ， 不 需要 网 络 规模 知识 或 者 其 他 拓扑 信息 ， 也 不 需 
要 对 网 络 命名 。 简 单 同步 器 算法 的 通用 性 表明 ， 所 有 同步 算法 可 用 异步 网 络 模拟 。 因 此 ， 能 
用 同步 算法 求解 的 所 有 问题 也 可 在 异步 系统 中 求解 。 


12.3.2 a、p 和 Y 同 步 器 


在 简单 同步 器 中 ， 每 次 脉冲 中 的 每 个 进程 与 它 的 每 个 近邻 通信 ， 使 得 模拟 每 个 脉冲 的 消 
息 复 杂 度 达到 B(IEI) 。 如 果 经 过 子 拓扑 结构 进行 通信 ， 则 可 降低 消息 复杂 度 (以 增加 时 间 复 
杂 度 为 代价 )。 同 步 器 导致 的 通信 的 目标 是 让 进程 得 知 ， 它 的 近邻 在 当前 脉冲 中 发 送 的 所 有 消 
息 已 经 收 到 。 

如 果 在 某 个 脉冲 进程 p 所 发 送 的 所 有 消息 被 接收 后 ， 则 进程 p 在 当前 脉冲 变 成 安全 的 。 对 
于 模拟 算法 中 的 每 条 消息 ， 都 发 送 一 条 确认 消息 ， 当 进程 p 收 到 每 条 消息 的 确认 消息 时 ， 它 变 
成 安全 的 。 现 在 ， 同 步 器 必须 提供 进程 之 间 的 通信 ， 通 过 通信 ， 进 程 得 知 它 的 所 有 近邻 是 安 
全 的 。 当 进程 P 已 经 验证 了 对 于 脉冲 ; 它 的 所 有 近邻 都 是 安全 的 之 后 ，p 就 处 理 脉冲 ;的 消息 ， 改 
变 状态 ， 并 开始 第 i+1 个 脉冲 。 

下 面 提出 的 a 和 同步 器 是 以 后 所 要 给 出 的 y 同 步 器 的 两 种 特例 。 这 三 种 同步 器 是 由 
Awerbuch[Awe85a] 提 出 的 。 

1. a 同步 器 

第 一 种 同步 器 ， 称 为 a 同步 器 ， 非 党 类似 于 简单 同步 器 。 在 同步 器 中 ， 经 过 每 个 信道 进行 
通信 : 每 个 安全 进程 向 它 的 每 个 近邻 发 送 消 息 <iamsafe>。 当 进 程 接收 到 每 个 近邻 的 消息 
<iamsafe> 时 ， 进 程 知道 它 的 所 有 近邻 是 安全 的 。 

初始 化 过 程 不 是 必要 的 ， 很 显然 ， 对 于 每 个 脉 串 ， 同 步 器 发 送 O(1E1) 条 消息 。 如 果 脉 钟 i 
的 最 后 一 次 模拟 发 生 在 时 间 !， 那 么 到 + +1, 这 个 脉冲 的 所 有 消息 已 被 接收 ， 到 t+2， 所 有 确认 
消息 已 被 接收 。 因 此 ， 到 :+2， 每 个 进程 是 安全 的 ， 到 1:43， 消息 <iamsafe> 已 被 接收 ， 并 允许 
所 有 进程 模拟 第 i +1 个 脉冲 ， 因 此 Tw = 3。 

2. 同步 器 

在 5 同步 器 中 ， 经 过 生成 树 进行 通信 。 当 子 树 中 的 所 有 进程 安全 时 ， 进 程 向 它 的 父 节点 发 
送 消息 <ts>(“ 树 是 安全 的 ”)， 这 就 是 当 进 程 自身 是 安全 的 ， 并 从 它 在 树 中 的 每 个 子 节点 接收 
到 消息 <ts> 时 出 现 的 情况 。 当 根 节点 是 安全 的 ， 并 已 经 接收 每 个 子 节 点 的 消息 <ts>， 则 所 有 
进程 是 安全 的 。 根 节点 经 过 生成 树 发 送 消息 <pulse>， 让 每 个 进程 知道 在 当前 脉冲 中 的 所 有 进 
程 是 安全 的 。 接 收 消息 <pulse> 表 明 ， 所 有 进程 是 安全 的 。 这 理 含 着 ， 接 收 进程 的 所 有 近邻 是 
安全 的 ， 因 此 进程 进行 到 下 一 个 脉冲 。 

同步 器 需要 初始 化 阶段 ， 在 这 一 阶段 中 计算 生成 树 。 7.3 节 表明 ， 假 如 惟一 标识 可 用 ， 利 
用 B(N log N +E) 条 消息 ， 可 以 计算 出 生成 树 。 利用 O(N) 个 时 间 单 位 的 方法 是 可 能 的 。 集 
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中 式 算法 利用 O(IBI) 条 消息 ， 在 O(N) 时 间 单 位 内 ， 可 以 计算 出 生成 树 。 

除了 确认 消息 ， 每 个 脉冲 要 求 经 过 树 的 每 条 边 ， 发 送 消 息 <ts> 和 <pulse>， 共有 O(N) 条 
控制 消息 。 所 花费 的 时 间 与 树 的 深度 成 正比 。 在 最 坏 情 况 下 时 间 为 R(N)。 

3. 7 同步 器 

y 同步 器 要 求 初始 化 阶段 ， 在 这 一 阶段 中 将 网 络 划 分 成 徐 。 在 每 一 徐 内 ， 算 法 操作 如 同 B 
lea. FER ZI, PERE dole ol] eB. 

FROG —-T BE RAM -TRGAS A, CER RI. OPE 
( 称 两 个 簇 是 近邻 ， 如 果 在 这 两 个 簇 中 的 节点 之 间 ， 存 在 一 条 边 ) ， 选 择 两 近邻 秘 之 间 的 一 条 a 
首选 边 (preferred edge )。 同 步 过 程 由 5 步 组 成 。 

(1) 如 果子 树 中 的 所 有 进程 是 安全 的 ， 即 ， 如 果 进 程 是 安全 的 ， 并 且 已 经 收 到 每 个 子 节 
点 的 消息 <ts>， 则 进程 向 徐 树 中 的 父 节点 发 送 消 息 <ts>。 

(2) 如 果 秘 的 领导 人 是 安全 的 ， 并 且 已 经 收 到 每 个 子 节点 的 消息 <ts> ， 那 么 ， 猎 中 所 有 
进程 是 安全 的 ， 经 过 簇生 成 树 发 送 消 息 <es> (“cluster safe”， 奥 是 安全 的 )， 让 徐 中 每 个 进程 
知道 ， 簇 中 所 有 进程 是 安全 的 。 

(3) RAPS KARAM) RPA, RIKI, Xx 
个 饶 是 安全 的 。 为 此 ， 当 接 到 消息 <ecs> 时 ， 就 通过 首选 边 发 送 消息 <ocs> (“our cluster safe”, 
我 们 的 簇 是 安全 的 )。 | 

(4) 在 每 个 簇 树 中 ， 向 上 发 送 消息 ， 报 告 所 有 近邻 侯 是 安全 的 。 当 由 它 的 生成 树 中 的 首 
选 边 连 接 的 所 有 近邻 焦 被 报告 是 安全 的 ， 在 敌 树 中 ， 进 程 就 向 父 节 点 发 送 消息 <ncs> 近 邻 答 是 : 
安全 的 )。 

(5) 当 灸 领导 人 接收 到 每 个 子 节点 的 消息 <ncs> 和 每 条 依附 首选 边 的 消息 <ocs> 时 ， 那么 
所 有 近邻 秘 是 安全 的 。 当 这 种 情况 发 生 时 ， 灸 自身 是 安全 的 ， 经 过 徐 树 发 送 消息 <pulse>， 和 触 
发 舌 中 每 个 进程 开始 下 一 次 脉冲 。 

当 进 程 接收 到 消息 <pulse> 时 ， 它 的 比 和 近邻 比 是 安全 的 。 这 曾 含 着 ， 所 有 它 的 近邻 是 安 
全 的 。 

为 了 确定 同步 器 的 复杂 度 ， 对 于 敌 c， 设 已 是 c 中 树 边 和 首选 边 的 数目 ， 瓦 是 c 中 树 的 最 大 
高 度 。 因 为 同步 器 经 过 每 个 树 边 发 送 四 条 消息 (<ts>，<es>，<ncs> 和 <pulse> )， 经 过 每 条 首 
选 边 发 送 两 条 消息 (两 条 消息 <ocs>)， 模 拟 每 次 脉冲 ，M,ww 为 O( EE。)。 设 :是 脉 串 最 后 模拟 的 
时 间 。 在 时 间 t:+2， 所 有 进程 是 安全 的 ， 在 时 间 1+2 + 下 ， 领 导 人 知道 所 有 灸 是 安全 的 ， 而 在 
时 间 # +2 + 24.， 所 有 进程 已 经 收 到 消息 <ces>， 并 经 过 每 条 首选 边 发 送 消息 <ocs>。 在 时 间 1 + 
3 + 2H.， 所 有 消息 <oes> 已 被 接收 ， 在 时 间 t +3 + 3 及 .， 每 簇 的 根 知道 所 有 近邻 筷 是 安全 的 ， 
且 在 时 间 t +3 + 48.， 所 有 进程 接收 到 消息 <pulse>， 模 拟 下 一 次 脉 串 。 于 是 ，Towwe 为 O(,)。 

如 果 把 整个 网 络 看 作 一 个 给， 那么 E。 = N-1 和 H, = O(N)， 此 时 本 同步 器 与 同步 器 8 相同 。 
如 果 将 每 个 节点 看 作 一 个 答 ， 那 么 E. = E 和 H. = 0(1)， 此 时 同步 器 与 同步 器 a 相 同 。 

4. 计算 合适 的 簇 

7 同步 器 的 复杂 度 取决 于 算法 中 所 用 的 包 。 通 过 徐 ， 我 们 特别 进行 如 下 规范 : 

(1) WARES (连通 子 图 )。 

(2) 每 簿 一 个 中 心 (领导 人 ) 和 一 棵 有 根 生成 树 。 

(3) 每 一 对 近邻 得 之 间 有 一 条 首选 边 。 
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定理 12.6 对 于 每 个 ，2< k<N， 存 在 一 个 廊 c 满 足 E。 <k: NEH, <log N/ log k, 

证 明 。 通 过 选择 徐 C1|，C，,，... 逐 步 构 造 徐 Cl!，C,;,，...。 假 设 已 经 选择 簇 C!，...，C,， 那 么 
网 络 中 存在 剩余 不 属于 任何 C, 至 C, WRR. 

为 了 构造 Ce， 在 剩 下 的 节点 中 ， 选 择 一 个 节点 p 作 为 簇 的 领导 人 ， 并 向 徐 中 一 层 一 层 地 
增加 节点 。 一 个 节点 {P} 是 簇 的 第 一 层 。 在 C… 的 第 ; 层 构造 完 之 后 ， 令 "表示 Cr 中 的 结 点 数 ， 
考虑 不 属于 任何 簇 的 第 i 以 的 节点 的 近邻 集合 5。 如 果 5 的 大 小 至 少 为 《k-1) n， 则 将 5 中 的 节 
点 被 加 到 Ci 中 作为 下 一 层 。 否 则 ， 如 果 5 中 包含 的 节点 数 少 于 (k-1) n， 那 么 C,,! 的 构造 完 
成 。 

秘 的 构造 过 程 表 明 ， 一 个 有 i 层 的 矮 ( 即 ， 深 度 为 -1 的 生成 树 ) Baek PMA, A 
th, H.thlog.N = log N/log kk 限定。 

簇 中 树 边 数 不 超 过 N， 因 为 树 边 形成 网 络 的 生成 森林 。 对 于 每 两 个 近邻 给 ， 选 择 一 条 首选 
边 ， 并 使 这 条 边 属于 这 两 个 灸 中 第 一 个 被 建立 的 簇 。 当 剩 下 的 近邻 节点 数 比 簇 的 规模 小 二 1 倍 
时 ， 完 成 艇 的 构造 。 这 蕴含 着 ， 对 于 大 小 为 4 的 徐 ， 以 后 至 多 要 建立 (k-1)n 个 近邻 徐 。 因 此 ， 
RIT HEH, Keb ARES A (k-1)n 条 首选 边 ， 首 选 边 数 不 会 超过 (kX-1)N。 这 就 证 
明了 E.<k.N。 a 
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图 12-3 同步 器 算法 一 览 


Awerbuch[Awe85a] 给 出 了 实现 这 个 构造 的 分 布 式 算法 。 算 法 利用 O(k . M) 条 消息 。 时 
间 复 杂 度 为 O(N log N / log k) 个 时 间 单 位 。 


12.4 应 用 : 广度 优先 搜索 


作为 同步 器 的 应 用 ， 本 节 提 出 几 种 计算 网 络 广度 优先 搜索 (BES) 生成 树 的 算法 。 网 络 G 
的 一 棵 生成 树 7 是 广度 优先 搜索 树 (breadth-first search ) ， 如 果 对 于 每 个 节点 ， 到 树 根 的 路 径 
是 G 中 的 最 小 跳 数 路 径 、 即 ， 对 于 它 的 根 ， 广 度 优先 搜索 树 是 一 棵 最 优 汇 集 树 ， 以 最 小 跳 数 距 
离 度 量 (参见 定理 4.2 )。 

广度 优先 搜索 树 在 设计 消息 和 时 间 有 效 算法 方面 起 着 重要 的 作用 ， 因 为 可 以 用 最 少 的 时 
间 进 行 信息 的 最 优 消息 广播 。 利 用 BFS 树 ， 可 使 Santoro 和 Khatib (4.4.2 小 节 ) 的 树 标 号 模式 
更 有 效 地 工作 。Frederickson[Fre85] 利 用 BFS 树 ， 有 效 地 解决 了 最 短路 径 问 题 。 

集中 式 算法 可 进行 BFS 树 的 计算 ,该 集中 式 算法 从 树 根 开始 (假设 已 定义 了 优先 级 )。 根 
据 参 数 N 和 IEI， 本 节 分 析 了 广度 优先 搜索 算法 的 复杂 度 。 观 察 可 见 ， 树 的 深度 不 超过 NN。 经 过 
更 仔细 的 分 析 ， 可 以 建立 关于 参数 N、IEI 和 D 的 复杂 度 。 树 的 深度 受 D 所 限 。 

在 12.4.1 小 节 ， 首 先 证 明 ，BFS 树 的 计算 在 同步 网 络 中 是 非常 简单 的 。 事 实 上 ， 回 波 算 法 
每 次 执行 都 会 产生 一 棵 BFS 树 。 在 12.4.2 小 节 中 ， 同 步 算法 将 与 同步 器 算法 组 合 ， 并 通过 列表 
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给 出 了 几 种 方法 ,复杂 度 之 间 的 比较 。12.4.2 小 节 介 绍 的 异步 算法 容易 得 到 ， 且 易于 理解 ， 但 
是 较 之 其 他 算法 ， 它 们 不 是 很 有 效 。 我 们 最 后 讨论 了 由 Frederickson[Fre85] ( 12.4.3 小 节 ) 提 
出 的 两 个 异步 算法 。 


12.4.1 同步 BFS 算 法 


一 种 建立 BFS 树 的 自然 方法 就 是 按照 层次 计算 树 。 初 始 时 ， 根 形成 第 0 层 ， 在 完成 第 ; 层 之 
后 ,通过 添加 第 i 层 节 点 的 近邻 ， 就 可 将 树 扩展 到 第 i+1 层 。 

在 计算 广度 优先 搜索 树 的 同步 算法 中 ， 每 个 进程 只 在 一 个 脉冲 中 ， 向 它 的 每 个 近邻 发 送 
消息 。 初 始 进程 在 第 一 个 脉冲 中 这 样 做 。 如 果 ; 是 进程 接 到 一 至 多 条 消息 的 第 一 个 脉冲 ， 那 么 
其 他 每 个 进程 在 脉冲 i+1 发 送 消 息 。 在 脉冲; 中 第 一 次 接收 到 消息 的 进程 ， 将 其 自身 赋 给 第 i 层 ， 
并 从 脉冲 中， 那些 可 以 从 其 处 接收 到 消息 的 那些 进程 中 ， 选 择 一 个 进程 作为 自己 的 父 节点 。 

定理 12.7 根据 上 述 算法 ， 与 初始 进程 相距 为 i 的 进程 ， 在 脉冲 计 1 发 送 消息 ， 并 且 如 果 i > 
0， 它 选择 距 初 始 进程 为 i-1 的 一 个 进程 作为 它 的 父 节点 。 

父 节 点 的 选择 蕴含 着 ， 所 得 的 树 是 一 棵 广度 优先 搜索 树 ， 因 为 每 个 进程 只 发 送 一 次 消息 ， 
消息 复杂 度 为 21El。 由 于 脉冲 N 之 后 ， 每 个 进程 已 经 决定 了 它 的 父 节点 ， 则 时 间 复 杂 度 为 
O(N). 


124.2 与 同步 器 组 合 


我 们 把 同步 算法 与 早先 本 章 前 面 讨论 的 同步 器 之 一 进行 结合 ， 可 得 ABD 网 络 或 异步 网 络 
的 广度 优先 搜索 算法 。 图 12-4 给 出 了 所 得 异步 算法 的 复杂 度 。 用 这 种 方法 得 到 的 算法 易于 理 
解 ， 但 不 是 最 著名 的 异步 算法 。 









消息 复杂 度 时 间 复 杂 度 
同步 O (N) 
同步 网 + ABD O (181) O (N) 
同步 网 + a O (N - IEt) O (N) 
同步 网 + B o (N?) O (N?) 

同步 网 + y O (k: N?) O ( yeah ) 
log k 

















简单 O (NMN+IE) O (N?) 
高 级 O (NVIEI) O(NVET) 
[AG85] O (1E|.2VsNioglogNw ) O ( N.2VigNiogiogw ) 









图 12-4 广度 优先 搜索 算法 的 复杂 度 


12.4.3 异步 BFS 算 法 
本 节 讨 论 三 个 广度 优先 搜索 异步 算法 。 与 前 面 小 节 所 讨论 的 算法 相 比 ， 这 些 算 法 具有 较 


低 的 复杂 度 。 在 异步 算法 设计 中 ， 读 者 不 应 认为 ， 在 异步 算法 的 设计 中 ， 采用 同步 器 的 概念 
是 毫 无 用 处 的 。 在 以 下 算法 的 设计 中 ， 隐 含 地 利用 了 同步 器 算法 。 


广度 优先 搜索 树 通 常 是 按照 层次 建立 的 。 在 完成 第 i 层 之 后 ， 在 那 层 的 (此 时 ， 它们 还 不 


十 树 中 的 节点 ) 节点 的 近邻 被 加 入 到 树 中 作为 第 i+1 层 。 考 虑 这 样 一 种 情况 ， 在 第 it1 层 的 构 
造 完 成 之 前 ， 第 i+2 层 的 构造 就 已 开始 。 在 层 计 1 中 节点 的 近邻 在 第 i+2 有 野 被 加 入 到 树 中 ,但 是 ， 





416 


262 PARDO RAH HK 


随后 ， 这 样 的 节点 也 可 能 成 为 第 ; 层 中 节点 的 近邻 ， 实 际 上 ， 节 点 的 层 应 该 是 计 1。 

以 下 给 出 的 简单 算法 通过 对 每 两 层 的 树 之 间 进 行 同步 扩展 避免 了 这 种 情况 。 按 照 同步 器 5 
进行 同步 ， 并 应 用 于 已 构造 的 部 分 树 中 。 在 更 高 级 的 算法 中 ， 每 ! 层 后 ， 就 会 发 生 一 次 同步 。 
这 降低 了 由 于 同步 带 来 的 开销 。 但 要 求 一 个 节点 在 计算 过 程 中 ， 可 能 位 于 不 同 层 的 树 中 。 

在 最 终 BFS 树 中 的 节点 的 层次 等 于 在 整个 网 络 中 它 与 根 的 距离 。 层 为 1 的 节点 只 有 层 为 
f-1、 帮 f+1 的 近邻 参见 习题 12.9。 

1. 简单 算法 

为 了 开始 算法 ， 初 始 进程 为 自己 赋值 为 0 层 ， 此 后 BFS 树 的 第 0 层 构 造 完成 。 树 按照 层次 
构造 ， 当 第 f 层 构造 完成 时 ， 在 第 f 层 的 每 个 节点 知道 自己 在 第 f 层 ， 且 知道 它 近 邻 中 的 哪些 节 
点 在 广 1 层 。 

假设 第 f 层 构造 完成 ， 但 是 算法 还 未 终止 。 为 了 开始 第 f +1 层 的 构造 ， 初 始 进程 将 消息 
<forward, f > 沿 树 向 下 广播 。 在 第 / 层 的 节点 p， 一旦 收 到 消息 <forward，f >， 就 把 消息 
<explore，f +1> 发 送 到 p 还 不 知道 是 在 第 f -1 层 的 那些 近邻 中 。 消 息 <explore，f +1> 的 发 送 过 
程 见 图 12-5。 


— 消息 <explore, f+ I> 





4 + + + + 


第 0 层 第 1 层 第 / 层 AME 
图 12-5 第 f+1 层 的 构造 


第 f 层 的 所 有 节点 发 送 消息 <explore，f +1> 后 ， 则 距离 初始 进程 为 / +1 的 节点 从 第 f 层 的 每 
个 近邻 接收 到 这 样 一 条 消息 。 节 点 接收 到 的 第 一 条 消息 <explore，f > 定义 了 第 f 层 以 及 BFS 树 
中 节点 的 父 节 点 ， 并 用 消息 <reverse，true> 回 答 。 随 后 到 达 的 消息 <explore，f'> 用 消息 
<reverse，false> 回 答 。 已 知 这 些 消 息 的 所 有 发 送 者 在 第 f -1 层 。 观 察 可 见 ， 当 第 f +1 层 构造 
完成 时 ， 这 蕴含 着 ， 所 有 <explore，f+1> 消 息 都 得 到 回答 ， 在 第 f +1 层 的 每 个 进程 知道 它 的 哪 
些 近 邻 处 在 第 /县 。 

在 第 f 层 的 节点 也 可 能 收 到 消息 <explore, f +1>， 即 收 到 层 也 为 /的 近邻 的 消息 。 这 些 消 息 
不 用 消息 <reverse，b> 回 答 ， 因 为 发 送 给 这 个 近邻 的 消息 <explore，f +1> 被 解释 为 <reverse ， 
false> 消 息 。 

在 第 f 层 的 节点 等 待 对 于 它们 所 发 送 的 所 有 消息 <explore，f +1> 的 应 答 。 应 答 或 是 消息 
<reverse, b> (由 第 f +1 层 的 新 节点 发 送 ， 它 是 第 点 的 子 节点 ， 当 且 仅 当 5b = true)， 或 是 消息 
<explore，f +1> (由 层 也 为 /的 近邻 发 送 )。 层 至 多 为 /的 每 个 节点 向 它 在 树 中 的 父 节点 转发 消 
Ai<reverse, b>, 报告 由 其 子 树 中 的 节点 所 发 送 的 所 有 消息 <explore，f +1> 已 经 得 到 应 答 。4 
的 值 为 rue ， 当 且 仅 当 新 节点 已 经 被 加 入 到 子 树 中 。 在 第 / 层 的 节点 在 收 到 自己 发 送 的 对 每 个 
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消息 <explore，f +1> 的 应 答 时 ， 发 送 消息 <reverse，b>， 如 果 在 这 些 应 答 消 息 中 ， 至 少 有 一 
条 消息 为 <reverse，true>， 则 b = true。 如 果 收 到 它 的 每 个 子 节点 的 消息 <reverse，b'>, 在 小 
于 /的 层 上 的 节点 ， 就 向 它 的 父 节 点 发 送 消息 <reverse，b> 。 如 果 在 所 接收 到 的 消息 中 ， 至 少 
已 有 一 条 消息 为 <reverse, true>, MIb = true. 

当 根 节点 收 到 每 个 子 节点 的 消息 <reverse，b> 时 ， 第 f +1 层 的 构造 终止 。 如 果 没 有 节点 被 
加 入 树 中 (所 有 接收 到 的 消息 包含 值 false )， 则 树 的 构造 终止 。 否 则 继续 构造 第 f +2 层 。 

定理 12.8 利用 集中 式 异 步 算 法 构造 广度 优先 搜索 树 ， 消 息 复 杂 度 为 O(NM)， 时 间 复 杂 度 
为 O(N2) 个 时 间 单 位 。 

证 明 。 至 多 N 层 后 ， 构 造 终止 ， 每 一 层 的 每 条 树 边 至 多 传送 一 次 转发 或 者 explore 消 息 ， 
并 发 送 一 条 reverse 消 息 来 应 答 。 而 连接 第 f 层 的 两 节点 的 非 树 边 ， 在 第 f +1 层 的 构造 过 程 中 ， 
传送 两 条 消息 <explore，f +1>。 而 连接 两 节点 (一 个 在 第 f 层 ， 一 个 在 第 f +1 层 ) 的 非 树 边 ， 
在 第 六 +1 层 的 构造 过 程 中 ， 传 送 一 条 消息 <explore， +1> 和 一 条 消息 <reverse，false>。 在 其 
中 的 任何 一 种 情况 下 ， 非 树 边 为 整个 算法 只 传送 两 条 消息 。 因 此 ， 消 息 的 复杂 度 为 2N(N-1) 
+2 (IEI- (N-1))<2N+2IEl = O(N’). Bf +1 的 计算 需要 2(f+1) 时 间 单 位 。 这 蕴含 着 算法 至 
ZEON) 个 时 间 单 位 后 终止 。 口 

2. 高 级 算法 

在 简单 算法 中 ， 每 一 层 的 探测 由 根 进行 同步 (通过 逆转 和 转发 消息 )。 从 复杂 度 分 析 可 证 
明 ， 同 步 消息 控制 着 算法 的 复杂 度 。 如 果 网 络 是 稠密 的 ( 即 |EI 几 乎 为 8( 和 VV))， 由 于 IEl 是 消息 1418 
数 的 下 界 ， 所 以 不 能 改进 消息 复杂 度 。 如 果 网 络 是 稀 玻 的 《 即 IE| 为 O(N?))， 可 以 在 同步 的 轮 
数 之 间 ， 探 索 几 层 ， 来 减少 同步 的 开销 。 

假设 完成 了 树 的 第 f 层 的 构造 。 为 了 构造 下 一 个 ! 层 , 初始 进程 沿 树 向 下 广播 消息 <forward， 
fP. 一 旦 接收 到 这 个 消息 ， 第 f 层 的 节点 向 那些 近邻 发 送 消息 <explore，f +1, >, EERE 
不 为 第 广 1 层 所 知 。explore 消 息 的 第 一 个 参数 表示 接收 者 的 新 层 数 ， 如 果 接 收 者 变 成 发 送 者 的 
一 个 子 节点 。 第 二 个 参数 表示 从 消息 的 发 送 者 开始 必须 被 探索 的 层 数 。 

Mik, TAR. WR—-RAA<explore, f, DHA AD, RH Spy 4 Al level, 
比较 。 如 果 f > level,， 就 发 送 消息 <reverse，false> 应 答 。 如 果 f < level,，p 将 消息 的 发 送 者 作 
为 它 的 父 节 点 ， 并 把 层 变 为 P 并 且 如 果 ! > 1， 就 向 那些 近邻 发 送 消 息 <explore, f +1, [-1>, 
这 些 近 邻 还 不 为 第 f +1 层 所 知 ( 后 者 就 是 这 样 一 种 情况 ， 即 ， 如 果 以 前 就 从 这 个 近邻 接收 消息 
<explore，/+2，!>)。 第 什 1 层 至 f + ! 层 构造 的 终止 性 ， 可 通过 将 reverse 消 息 扩 散 以 应 答 
explore 消 息 和 转发 消息 来 进行 检测 。 就 像 在 简单 算法 中 那样 。 

定理 12.9 ”如 果 iEl 和 NN? 之 间 的 比率 (近似 地 ) 已 知 ， 可 用 集中 式 异 步 算法 构造 一 棵 广度 
优先 搜索 树 ， 消 息 复杂 度 为 O (NYE )， 时 间 复 杂 度 为 O (NA 巨 )。 

证 明 。 经 过 大 约 N/! 轮 同步 后 ， 构 造 过 程 终止 ， 每 一 条 树 边 至 多 传送 2N/1 条 转发 消息 和 对 
转发 消息 的 应 答 ， 共 需 O( N21)。 每 条 边 至 多 传送 /条 探索 消息 和 ! 条 对 它们 的 应 答 ， 共 有 
OEI) 条 消息 ， 这 使 得 消息 复杂 度 达到 O(NYI + UIE1)。 因 为 第 f +1 层 至 f +! 层 的 计算 需要 
O(f+1) 个 时 间 单位 ， 算 法 的 时 间 复 杂 度 为 O(N2/1)。 

通过 选择 /为 YN?/E ， 可 得 定理 中 所 规定 的 复杂 度 的 界限 。 口 

3. Awerbuch-Gallager 算 法 

通过 引入 更 多 的 同步 机 制 ，Awerbuch-Gallager[AG85] 可 以 进一步 减少 广度 优先 搜索 的 复 
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杂 度 。 在 各 轮 同 步 之 间 所 探索 的 ! 层 称 为 带 (strip)。 在 Awerbuch-Gallager 算 法 中 ， 不 仅 在 每 两 
条 带 的 探索 之 间 存 在 全 局 同步 ， 而 且 通过 探索 过 程 中 建立 的 生成 木林， 每 条 带 自身 的 探索 也 
是 同步 的 。 算 法 过 于 复杂 ， 在 这 里 不 作 详 细 的 解释 。 但 为 了 完整 性 ， 在 表 12-4 中 列 出 了 它 的 
复杂 度 。 


12.5 Archimedean 假设 


取决 于 物理 时 钟 的 可 用 性 ， 进 程 可 能 看 到 时 间 ， 也 可 能 看 不 到 。 即 使 看 不 到 时 间 ， 所 谓 
的 Archimedean 假 设 也 可 能 被 证 明 是 合理 的 。 按 照 这 一 假设 ， 进 程 的 某 一步 或 者 消息 传输 的 某 
一 步 所 消耗 的 最 大 可 能 时 间 和 最 小 可 能 时 间 的 比率 有 界 。 

即使 系统 没有 装备 测量 实际 时 间 的 设备 ， 也 可 以 获得 时 钟 的 粗略 表示 ， 例 如 ， 通 过 计算 
每 个 处 理 器 执行 的 指令 数 ， 以 及 定义 每 1000 条 或 者 10 000 条 指令 为 时 钟 的 一 次 吐 暴 。 进 程 中 
所 “ 扫 过 的 时 间 ” 为 那个 进程 中 所 计算 的 时 钟 吐 噶 数 。 接 下 来 ， 用 m 和 zz 表示 物理 时 间 的 实例 。 
时 间 # 和 ts 可 从 上 下 文中 理解 ， 设 m 表 示 4 和 之 间 任意 进程 的 两 次 连续 时 钟 吐 嘲 之 间 的 最 小 时 
间 ， 设 wu 表示 nL 和 之 闻 任 意 消 息 的 最 大 传输 延迟 与 和 刀 之 间 任意 进程 的 两 个 连续 时 钟 嘛 蜡 之 
间 的 最 大 时 间 之 和 。 称 比率 wm 为 间隔 (1), t) 的 Archimedean 比 率 。 

定义 12.10 如 果 比 率 u/m 有 界 s， 则 系统 是 Archimedean 的 (有 Archimedean 比 率 s)。 

给 定 4 和 t:， 在 4 和 t 之 间 时 钟 暗 哄 和 消息 出 现 的 次 数 是 有 限 的 。 这 薄 含 着 ， 存 在 ;， 满 足 系 
统 是 Archimedean 的 ， 且 具有 比率 *。 对 于 许多 系统 ， 这 可 能 是 一 个 合理 的 假设 ， 即 ， 如 果 存 
在 go， 满足 系统 是 Archimedean 的 ， 且 具有 位 于 由 系统 执行 的 算法 的 开始 和 终止 之 间 的 比率 *。 
ZASE, CRM, (FAY) 同步 假设 被 验证 ， 但 是 否 这 种 形式 的 弱 同 步 可 用 于 设计 有 
效 的 分 布 式 算法 ， 仍 然 是 一 个 问题 。 

已 经 证 明 ， 利 用 完全 异步 算法 且 不 依赖 于 定时 假设 会 更 好 。 有 如 下 几 个 原因 : 

(1) 系统 中 最 慢 组 件 〈 与 最 快 组 件 一 起 ) 决定 了 Archimedean 比 率 值 。 如 果 算 法 的 时 间 复 
杂 度 受到 比率 的 影响 (通常 如 此 )， 那 么 最 慢 的 组 件 决定 了 整个 系统 的 速度 。 

(2) 对 延 时 假设 的 分 析 相 当 困 难 ， 并 且 会 导致 不 正确 的 算法 。 

(3) 算法 执行 中 任意 延迟 的 引入 (例如 ， 在 被 用 于 Dijkstra、Feijen 和 Van Gasteren 的 终止 
检测 算法 的 环 算 中 ) 可 能 使 得 Archimedean 假 设 无 效 。 因 此 ， 如 果 算 法 依赖 于 Archimedean 假 
设 ， 就 不 能 使 用 这 项 算法 技术 。 

(4) 用 更 快 或 更 慢 的 组 件 替换 系统 中 的 组 件 ， 可 能 改变 Archimedean 比 率 ， 也 可 能 使 得 算 
法 传输 错误 的 结果 。 这 种 类 型 的 错误 是 极其 难以 跟踪 和 修复 的 ， 因 为 错误 原因 是 用 功能 上 等 
价 的 组 件 代替 系统 中 的 组 件 所 至 。 

根据 这 些 假 设 ， 有 两 种 利用 Archimedean 假 设 的 方式 。 称 算法 是 健壮 的 (robust ) ， MRE 
的 正确 性 不 依赖 于 假设 ， 即 ， 算 法 在 一 个 完全 异步 系统 中 是 正确 的 。 Archimedean 假 设 用 于 算 
法 的 复杂 度 分 析 ， 它 可 能 揭示 出 ， 如 果 这 个 比率 接近 于 1， 算 法 就 表现 得 更 好 。 称 算法 是 临界 
的 (critical)， 如 果 它 的 正确 性 依赖 于 Archimedean 假 设 ， 即 ， 在 执行 过 程 中 ， 如 果 
Archimedean 比 率 超 过 设计 参数 s。， 则 算法 可 能 产生 错误 的 结果 。“ 按 时 间 编 码 ” 和 发 送 “ 隐 消 
息 ” 技 术 都 是 关于 Archimedean 假 设 临界 的 算法 ， 而 “选择 性 延迟 ”是 健壮 算法 ， 

Vitanyi[ Vit85] RH, 利用 选择 性 延迟 ,在 具有 一 条 消息 时 间 复 杂 度 的 Archimedean 系 统 中 ， 
可 以 健壮 地 进行 选举 ， 参 见习 题 12.11。 Spirakis 和 Tampakas[ST89] 已 经 提出 了 几 种 用 于 不 同 任 





RIZE APHRA 265 


务 的 健壮 和 临界 的 分 布 式 算法 。 
习题 


12.1 节 


12.1 改进 通过 “按时 间 编 码 ” 发 送信 息 的 协议 ,使 得 传输 消息 m 的 时 间 为 O( Ym ) 个 时 mi 
间 单 位 ， 且 利用 常数 个 位 。 

12.2 定理 9.8 阅 述 : 

如 果 环 规模 末 知 ， 不 存在 计算 非 - 常 函 数 /的 确定 进程- 终止 算法 。 

这 个 定理 对 于 同步 网 络 也 成 立 吗 ? 

12.3 ”证 明 图 12-1 所 示 的 算法 中 ， 在 第 i 个 脉冲 (局 部 时 钟 (2ih，2( 计 1) u) 的 间隔 ) 执 
行 中 ， 进 程 只 能 接收 第 i 个 脉冲 和 第 i +1 个 脉冲 的 消息 。 

( 园 而， 消息 的 脉冲 数 可 由 接收 时 间 和 脉冲 数 的 基 偶 性 确定 ) 

12.4 假设 按照 这 样 一 种 方式 扩展 图 12-1 中 的 算法 的 同步 阶段 ， 进 程 p 在 时 间 Tt 记 录 时 钟 时 
间 6, = CLOCK ， 在 此 时 ， 进 程 p 接 收 到 gq 的 消息 <start>。( 6 = 0 如 果 这 个 消息 引起 init 在 p 
中 执行 。) 证 明 当 六 接收 到 9 的 脉冲 ;的 消息 时 ， 忆 的 时 钟 值 介 于 6 +2iu-pFed,, +2iu + 之 间 。 

(因而 ， 在 时 钟 时 间 c 接 收 到 4 的 消息 的 脉冲 数 为 |(c-6o +1)/2]， 因 此 ， 与 消息 脉冲 数 有 关 
的 信息 不 需 包 含 在 消息 中 )。 

12.5 ”修改 图 12-1 所 示 的 算法 使 其 能 处 理 内 部 处 理 时 间 非 0 的 情况 。 而 是 假设 执行 P% 的 各 
序 体 所 需 时 间 为 人。 


12.2 节 


12.6 给 出 团 、 圆 环 以 及 超 立 方 体 上 扩散 消息 的 算法 ， 它 们 需要 N-1 条 消息 以 及 O() 个 
时 间 单 位 。( 必 须 假 设 园 环 和 超 立 方 体 是 有 标号 的 。) 
12.7 ”给 出 规模 已 知 的 网 络 同步 选举 算法 ， 在 这 种 情况 下 ， 进 程 无 需 都 在 同一 个 脉冲 中 
开始 选举 ， 而 是 可 以 在 不 同 的 脉冲 中 初始 化 算法 。 
12.3 节 


12.8 ”把 12.2 节 的 同步 算法 和 12.3 节 的 同步 器 结合 起 来 得 到 一 个 新 的 异步 选举 算法 ， 确 定 
这 个 算法 的 消息 复杂 度 。 


A 
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12.9 证 明 在 BFS 树 中 ， 第 / 层 一 个 节点 的 近邻 ， 层 为 上 -1、 或 者 F+1。 

12.10 根据 N、IEI 和 D (网 络 直径 ) 分 析 广 度 优先 搜索 算法 的 复杂 度 。 

12.5 节 

12.11 [Vit85] 本 习题 的 目的 是 研究 选择 性 延迟 在 Archimedean 网 络 中 的 效果 。 设 给 定 
Archimedean 比 率 为 的 网 络 。 

把 广 止 技术 应 用 于 消息 复杂 度 为 多 的 遍历 算法 进行 选举 。 进程 了 的 每 条 消息 在 每 个 进程 
中 廷 迟 扎 P) -1 个 时 钟 吐 哄 。 有 一 个 单独 的 唤醒 过 程 保证 ， 在 算法 开始 后 的 门 . 4 个 时 间 单 位 内 ， 
每 个 进程 开始 遍历 。 
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(1) 证 明 算法 在 D u+W- u- fip) 时 间 单位 内 终止 ， 其 中 po 是 具有 最 小 标识 的 进程 。 
(2) 证 明 在 长 为 ! 的 时 间 间 中 内 ， 进 程 p 的 令 牌 至 多 发 送 1 +t/(f(p)-2) 次 。 

(3) 导出 算法 的 最 坏 情况 下 的 消息 复杂 度 公式 。 

(4) 证 明 通 过 改变 f， 可 以 得 到 线性 消息 复杂 度 。 





第 13 章 分 布 式 系统 中 的 容错 


本 书 前 面 研究 的 分 布 式 系 统 中 所 达到 的 协同 行为 中 ， 进 程 是 可 靠 的 (reliable )。 由 于 儿 种 
原因 ， 在 假设 进程 可 能 发 生 故 障 的 情况 下 ， 研 究 进程 可 能 具有 的 协同 行为 是 非常 有 吸引 力 的 。 
这 项 研究 是 本 书 最 后 一 部 分 的 主题 。 容 错 问 题 的 许多 解决 方案 是 特定 的 (ad hoc)， 同时, 在 
收集 的 大 量 不 可 能 性 中 ， 有 时 难以 发 现 证 明 结构 和 基础 的 理论 。 另 一 方面 ， 有 些 问题 有 着 一 
流 而 完备 的 理论 以 及 简单 的 解决 办 法 。 对 它们 的 陈述 在 这 本 导论 性 的 教科 书 中 非常 适合 。 

本 章 作为 后 续 章节 的 导 引 。 我 们 说 明了 利用 容错 算法 的 原因 (13.1 市 )。 随 后 ， 介 绍 了 两 
种 主要 的 容错 算法 ， 即 健壮 算法 (13.245) 和 稳定 算法 (13.3 节 )。 


13.1 利用 容错 算法 的 原因 


分 布 式 系统 中 越 来 越 多 的 组 件 意味 着 ， 在 分 布 式 算法 的 执行 中 ， 某 些 组 件 将 发 生 故 障 。 
网 络 中 的 计算 机 可 能 发 生 故 障 ， 系 统 中 的 进程 可 能 由 于 断 开 工作 站 而 被 错误 地 杀 死 ， 或 者 由 
于 存储 器 发 生 故 障 ， 机 器 可 能 产生 不 正确 的 结果 。 现 代 计 算 机 变 得 越 来 越 可 靠 ， 使 得 单个 计 
算 机 发 生 这 类 故障 的 概率 降低 。 尽 管 如 此 ， 当 它 的 组 件数 增加 时 ， 分 布 式 系统 中 某 处 出 现 故 
障 的 机 会 可 能 任意 地 增 大 。 每 当 发 生 故障 时 ， 为 了 避免 重新 起 动 算法 ， 算 法 应 被 设计 成 能 够 
恰当 地 处 理 这 些 故障 。 

当然 ， 在 串 行 计算 机 中 ， 在 安全 为 主 的 应 用 中 ， 或 者 计算 运行 了 很 长 时 间 ， 产 生 了 不 可 
验证 的 结果 ， 易 于 受到 故障 影响 的 问题 是 值得 关注 的 。 可 进行 某 些 内 部 检查 ， 防 止 某 些 类 型 
的 错误 (例如 ， 模 块 检查 以 免 于 计算 错误 )。 但 是 没有 一 种 保护 机 制 可 以 达到 使 程序 完全 无 损 
或 使 代码 免 于 错误 更 改 。 因 此 ， 用 顺序 算法 和 单一 处 理 器 的 计算 机 系统 进行 容错 计算 的 可 能 
性 非常 有 限 。 

因为 在 分 布 式 系 统 中 ， 由 于 处 理 资源 的 传播 ， 这 些 系统 具有 部 分 故障 (Partial-failure) 性 
质 。 无 论 出 现 哪 种 故障 ， 通 常 只 影响 整个 系统 的 一 部 分 。 组 件数 的 增加 极 有 可 能 使 故障 就 发 
生 在 某 些 组 件 上 。 而 且 故 障 极 不 可 能 发 生 在 所 有 组 件 上 。 这 就 使 得 当 发 生 故 障 时 ， 可 由 其 他 
组 件 接管 发 生 故 障 的 进程 的 任务 ， 从 而 导致 性 能 下 降 ， 而 不 是 全 面 的 故障 。 确 实 ， 正 如 在 下 
面 章节 中 所 看 到 的 那样 ， 有 可 能 为 这 样 的 系统 设计 分 布 式 算法 ， 系 统 中 的 进程 是 有 缺陷 的 ， 
同时 也 可 实现 协调 工作 。 

对 于 本 质 上 不 是 分 布 式 却 要 求 高 可 靠 性 的 计算 机 应 用 设计 ， 部 分 故障 性 质 使 得 利用 分 布 
式 〈 复制 的 " ) 体系 结构 成 为 有 吸引 力 的 选择 。 航 天 飞机 的 主 计算 机 系统 就 是 一 个 例子 。 
Spector 和 Gifford[SG84] 描 述 了 它 的 研制 。 飞 机 主要 由 不 需 定制 的 微 处 理 器 控制 ， 在 设计 中 主 
要 关注 的 是 它 在 航行 过 程 中 处 理 器 发 生 故 障 的 可 能 性 。 最 终 控制 系统 由 4 个 相同 处 理 器 组 成 ， 
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每 个 处 理 器 只 进行 同样 的 计算 “ ， 激 励 者 号 对 结果 进行 投票 ， 即 使 一 个 处 理 器 发 生 故 障 ， 也 
能 完全 控制 系统 。( 激 励 者 号 的 物理 实现 表明 ， 即 使 第 二 个 处 理 器 后 来 发 生 故障 ， 系 统 也 能 继 
续 运行 。) 尽管 复制 是 增加 可 靠 性 的 有 吸引 力 的 一 种 选择 ， 但 是 需要 协调 一 群 (不 可 靠 ) 的 
处 理 器 的 算法 设计 远 非 那么 简单 。 由 于 精确 负责 任务 的 软件 中 的 一 个 错误 ， 致 使 航天 飞机 首 
航 延 期 (从 1981 年 4 月 8 日 延期 到 1981 年 4 月 10 日 ) 正 说 明了 这 一 点 。 

幸运 的 是 ， 自 从 1981 年 以 来 ， 容 错 算法 的 研究 取得 了 相当 大 的 进展 。 基 于 复制 技术 的 可 
靠 应 用 也 已 成 熟 。 

文献 中 出 现 了 两 种 很 不 同 的 容错 方法 。 本 书 研究 了 这 两 种 方法 。 在 健壮 算法 中 ， 每 个 进 
程 中 的 每 一 步 经 过 和 仔细 设计 ， 以 确保 尽管 发 生 故 障 ， 正 确 进程 只 执行 正确 的 步 只 。 在 稳定 算 
法 中 ， 正 确 进程 可 能 受到 故障 的 影响 ， 但 是 算法 保证 当 进 程 恢复 正确 行为 时 ， 可 以 从 任意 一 
个 配置 中 进行 恢复 。 在 13.2 节 和 13.3 节 ， 我 们 分 别 简要 地 介绍 了 健壮 算法 和 稳定 算法 ， 并 在 本 
章 最 后 ， 对 它们 作 了 简明 比较 。 


13.2 健壮 算法 


在 算法 的 执行 中 尽管 故障 出 现在 其 他 进程 中 ， 健 壮 算法 被 设计 成 可 以 保证 运行 正确 的 进 
程 其 行为 的 连续 性 和 正确 性 。 这 些 算法 依靠 某 种 策略 ， 如 表决 机 制 ， 通 过 该 机 制 ， 当 足够 多 
的 其 他 进程 宣称 已 经 接收 到 这 个 信息 的 时 候 ， 一 个 进程 将 只 接受 确切 的 消息 。 然 而 ， 如 果 进 
程 已 经 损毁 ， 就 可 能 出 现 死 锁 ， 一 个 进程 可 能 永远 不 能 接收 所 有 其 他 进程 的 信息 。 


13.2.1 故障 模型 


为 了 决定 运行 正确 的 进程 如 何 保护 自己 ， 免 受 故障 进程 的 影响 ， 必 须 作 出 这 样 的 假设 ， 
即 进程 怎样 才 可 能 发 生 故 障 。 在 以 下 的 章节 中 ， 总 是 假设 只 有 进程 才 可 能 发 生 故 障 ， 而 信道 
是 可 靠 的 。 因 此 ， 如 果 正 确 的 进程 向 另 一 正确 的 进程 发 送 消 息 ， 就 可 以 保证 在 有 限 的 时 间 内 
接收 到 消息 。( 故障 信道 可 用 某 个 所 依附 的 进程 中 的 故障 来 模型 化 ， 例 如 ， 省 略 故 障 。) 作为 
附加 假设 ， 我 们 总 是 假设 每 个 进程 可 以 向 其 他 每 个 进程 改 送 消息 。 

本 书 中 利用 下 面 的 故障 模型 (fault model). 

(1) 初始 死 进程 如 果 它 在 局 部 算法 中 没 执行 过 一 步 ， 则 称 进程 为 初始 死 进程 。 

(2) AAY (crash model) ”如 果 进 程 正确 地 执行 局 部 算法 到 某 一 时 刻 ， 此 后 并 不 进 一 
步 执 行 ， 则 称 它 是 损毁 的 。 

(3) Byzantine 行 为 (Byzantine behavior) 如果 它 执行 了 与 局 部 算法 不 一 致 的 任意 步 ， 则 
称 进 程 是 Byzantine 的 。 尤 其 是 Byzantine 进 程 发 送 的 消息 可 能 包含 任意 内 容 。 

健壮 算法 提出 的 正确 性 要 求 总 是 指正 确 进程 的 局 部 状态 (或 者 输出 )。 初 始 死 进 程 从 不 会 
产生 输出 ， 且 它 的 状态 总 是 等 于 它 的 初始 状态 。 如 果 损 毁 进程 有 输出 ， 则 它 的 输出 是 正确 的 ， 
因为 到 损毁 发 生 时 ， 进 程 的 行为 是 正确 的 。 不 用 说 ， 一 个 Byzantine 进 程 的 局 部 状态 或 者 输出 ， 
可 以 是 任意 的 ， 任 何 算法 都 不 满足 Byzantine 进 程 的 非 平 几 性 要 求 。 

1. 错误 模型 的 层次 ` 

可 将 错误 模型 分 为 三 个 层次 。 首 先 ， 初 始 死 进 程 可 看 作 损毁 进程 的 特例 ， 即 损毁 出 现在 


© 见 [SG84] 对 于 第 5 个 (“hot spare”) 处 理 器 和 第 6 个 (“cold spare” ) 处 理 器 的 解释 。 
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进程 的 第 一 个 事件 之 前 。 第 二 ， 损 毁 进 程 可 看 作 Byzantine 进 程 的 特例 ， 因 为 对 Byzantine 进 
程 假 设 的 任意 行为 包括 根本 不 执行 任何 一 步 。 因 此 ， 容 忍 损 毁 要 比 容忍 初始 死 进程 要 困难 ， 
而 容忍 Byzantine 进 程 则 更 困难 。 由 于 规定 不 同 ， 健 壮 Byzantine 算 法 也 是 健壮 损毁 算法 ， 而 
健壮 损毁 算法 也 是 健壮 初始 死 进程 算法 。 另 一 方面 ， 健 壮 初 始 死 进程 算法 的 不 可 能 性 旨 含 着 
健壮 损毁 算法 的 不 可 能 性 ， 而 健壮 损毁 算法 的 不 可 能 性 蕴含 着 健壮 Byzantine 算 法 的 不 可 能 
性 。 

省 略 故 障 包 括 跳 过 算法 中 的 某 些 步 〈 例 如 消息 的 发 送 或 接收 )， 此 后 算 东 继续 执行 。 省 略 
故障 是 Byzantine 行 为 的 特殊 情形 。 而 损毁 故障 是 省 略 故 障 的 特殊 情形 ( 即 ， 某 一 时 刻 后 ， 所 
有 步 都 被 省 略 )。 因 此 ， 省 略 故 障 的 层次 在 损毁 和 Byzantine 故 障 之 间 。 

2. 混合 故障 和 定时 错误 

初始 死 进程 和 损毁 故障 称 为 良性 (benign) 故障 类 型 ， 而 Byzantine 故 障 称 为 恶性 
(malign) 故障 类 型 。 对 于 几 种 分 布 式 问题 ， 如 果 2t < N， 则 N 个 进程 的 集合 可 以 容忍 ! 个 良性 
故障 ， 而 对 于 能 容忍 个 恶性 故障 的 健壮 算法 ， 要 求 3t1 < N (异步 计算 模型 ) 。 因 为 在 实际 中 ， 
常常 不 能 排除 恶性 故障 ， 但 是 与 良性 故障 相 比 ， 恶 性 故障 非常 少 。Garay and Perry[GP92] 将 
一 些 结果 扩展 到 混合 故障 模型 ， 其 中 t 个 进程 可 能 发 生 故 障 ， 当 中 的 b 个 是 恶性 故障 。 在 这 种 
模型 中 ， 如 果 2b + :< N (同步 计算 模型 )， 就 可 以 实现 其 余 进程 的 正确 行为 。 

在 同步 分 布 式 系统 中 ， 还 有 另 一 种 故障 模型 ， 即 进程 在 错误 时 间 执 行 正确 步 (由 于 进程 
时 钟 的 快 或 慢 )。 这 种 类 型 的 错误 进程 行为 称 为 定时 错误 (timing error), 


13.2.2 判定 问题 


健壮 算法 的 研究 是 以 所 谓 的 判定 问题 为 中 心 的 ， 要 求 每 个 正确 进程 必须 把 “判定 ” 值 写 
入 其 输出 中 。 所 要 求 的 判定 值 通常 以 十 分 平凡 的 方式 依赖 于 进程 输入 值 ， 这 使 得 在 无 故障 
(可 靠 ) 的 环境 中 解决 这 些 问 题 相当 容易 。 

对 于 判定 的 要 求 通常 有 三 种 类 型 ， 即 终止 性 、 一 致 性 和 非 平凡 性 。 

终止 性 要 求 说 明 ， 所 有 正确 进程 都 将 进行 判定 ， 即 最 终 向 输出 写 值 。 在 确定 性 算法 中 ， 
所 有 计算 中 都 要 求 终止 性 ， 在 概率 算法 中 ， 只 要 求 算法 以 概率 1 发 生 终止 〈 参 见 第 9 章 )。 所 有 
正确 进程 向 其 输出 写 值 的 要 求 排出 了 这 样 一 种 方法 ， 就 是 进程 必须 等 待 接收 来 自 超过 N-! 个 进 
程 的 信息 。! 个 进程 的 停止 引起 某 个 正确 进程 的 不 确定 的 等 待 ， 违 反 了 终止 性 要 求 。 

一 致 性 要 求 在 不 同 进程 所 进行 的 判定 之 间 强 加 了 一 种 关系 。 最 简单 的 情形 是 ， 要 求 所 有 
判定 是 相同 的 ， 一 致 性 问题 (consensus problem) 就 属于 这 种 情况 。 在 更 复杂 的 问题 中 ， 定 
义 一 类 输出 向 量 ， 正 确 进程 的 判定 形成 该 类 中 的 一 个 向 量 。 在 选举 问题 中 (第 7 章 )， 例 如 ， 
要 求 一 个 进程 判定 它 被 选 《“1”)， 所 有 其 他 进程 判定 失败 (“0” )。 

要 使 一 个 分 布 式 算法 有 用 ， 要 求 终止 性 和 一 致 性 就 足够 了 。 在 表明 任务 不 可 能 求解 的 情 
形 中 ， 就 需要 有 另外 的 要 求 。 非 平凡 性 要 求 排除 了 基于 问题 的 固定 输出 的 算法 ， 其 中 每 个 进 
程 不 经 通信 就 可 判定 。 例 如 ， 一 致 性 问题 可 用 一 个 算法 求解 ， 在 这 个 算法 中 ， 每 个 进程 直接 
向 输出 写 “0”。 非 平凡 性 要 求 表明 ， 在 算法 的 不 同 执行 中 存在 两 种 本 质 上 不 同 的 输出 ( 即 在 
一 致 性 的 情形 下 ， 算 法 要 进行 写 “0” 的 执行 及 写 “1” 的 执行 ， 当 然 ， 在 一 次 执行 内 ， 所 有 
判定 是 一 致 的 )。 
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判定 问题 对 大 量 分 布 式 计 算 中 的 一 般 情况 进行 了 抽象 ， 正 如 我 们 现在 所 要 讨论 的 。 

(1) 提交 中止 ”在 一 个 分 布 式 数据 库 中 ， 涉 及 多 个 站 点 的 事务 处 理 ， 必 须 在 所 涉及 的 所 
有 站 点 上 或 者 不 在 任何 这 类 站 点 上 执行 。 因 此 在 宣布 更 新 这 些 站 点 的 数据 之 后 ， 每 个 站 点 要 
决定 是 否 执行 局 部 更 新 ， 并 进行 “yes” 或 “no” 的 表决 。 随 后 ， 所 有 正确 站 点 必须 进行 判定 ， 
是 否 提交 (commit) 事务 ， 若 提交 ， 意 味 着 它 将 在 各 处 执行 ， 若 中 止 ， 意 味 着 它 将 不 能 执行 。 
如 果 所 有 进程 投票 “yes”， 进 程 必须 判定 提交 ; 如 果 一 些 进程 投票 “no”， 则 判定 结果 一 定 是 
中 止 。 一 致 性 的 含义 是 所 有 判定 是 相等 的 ， 问 题 是 非 平凡 的 ， 因 为 依赖 于 输入 且 对 提交 和 中 
止 都 有 要 求 。 

(2) 分 布 式 计算 输入 的 一 致 性 ”在 系统 中 ， 当 计算 被 复制 时 ， 就 提高 了 可 靠 性 ， 仅 当 计 
算是 基于 相同 输入 时 ， 各 个 处 理 器 的 结果 才 会 相等 。 有 缺陷 的 向 各 个 处 理 器 发 送 不 同 值 的 传 
感 器 的 影响 ， 必 须 通过 在 处 理 器 间 执 行 一 致 性 算法 来 消除 。 每 个 处 理 器 的 输入 就 是 从 传感器 
接收 的 值 ， 每 个 (正确 的 ) 处 理 器 必须 对 将 在 后 续 计算 中 使 用 的 相同 的 值 进行 判定 。 通 常 要 
求 输出 是 大 部 分 输入 的 值 ， 或 者 更 少 一 些 ， 可 以 是 至 少 作 为 输入 出 现 过 一 次 的 值 。 在 这 两 种 
情况 下 ， 问 题 是 非 平凡 的 。 

(3) 选举 在 选举 问题 中 (参见 第 7 章 )， 要 求 一 个 进程 判定 成 为 领导 人 ， 而 其 他 所 有 
(正确 ) 进程 判定 为 非 领导 人 。 如 果 我 们 要 求 潜在 的 不 同 的 进程 能 够 成 为 领导 人 ， 问 题 就 变 成 
非 平凡 的 。 

(4) 近似 一 致 ” 当 输入 的 一 致 性 达 不 到 时 ， 对 于 某 些 应 用 ， 更 弱 的 一 致 性 就 足够 了 。 在 
近似 一 致 的 问题 中 ， 每 个 进程 输入 为 一 个 整数 ， 取 自给 定 的 有 限 范围 ， 如 ，1，...，k。 要 求 
进程 的 判定 至 多 相差 1， 并 且 判 定 结果 位 于 实际 上 作为 输入 出 现 的 那些 值 中 。 也 可 参见 14.3 节 
关于 本 问题 的 继续 曾 述 ( -近似 一 致 )。 


13.2.3 第 14 章 到 第 16 章 综述 


由 于 存在 大 量 关于 健壮 算法 方面 的 成 果 ， 本 书 中 ， 不 可 能 完全 讨论 该 领域 的 最 新 成 果 。 
第 14 章 到 第 16 章 所 呈现 的 材料 是 按照 如 下 标准 进行 选择 的 。 

(1) 一 些 基本 结果 应 该 被 包括 : 在 异步 系统 中 ， 不 存在 确定 的 一 致 性 ， 在 多 达 一 半 的 进 
程 中 ， 概 率 算法 容忍 良性 故障 ， 或 者 在 多 达 三 分 之 一 的 进程 中 ， 容 忍 恶性 故障 。 

(2) 给 出 一 些 用 于 获得 健壮 性 或 证 明 不 可 能 性 的 技术 示例 。 

(3) 示例 应 该 包括 ， 同 步 系 统 可 以 达到 比 异 步 系 统 更 大 的 健壮 性 。 这 与 第 12 章 所 提出 的 
结果 形成 对 比 ， 第 12 章 中 的 结果 表明 可 靠 的 同步 系统 并 不 比 可 靠 的 异步 系统 更 强大 。 

(4) 故障 检测 器 是 有 希望 的 新 范 型 ， 它 可 以 很 快 地 成 为 应 用 技术 ， 也 应 该 被 包括 进来 。 

第 14 章 研究 了 蜡 步 系统 能 够 达到 的 健壮 性 。Fischer、 Lynch and Paterson[FLP85] 展 示 了 一 
些 基 本 的 结果 ， 对 于 一 致 性 问题 ， 不 存在 甚至 能 容忍 一 个 损毁 故障 的 确定 算法 。Moran and 
Wolfstahl[IMW87] 把 这 个 结果 推广 到 更 加 广泛 的 一 类 判定 问题 (AES) 上 ， 例 如 ， 包 括 选举 问 
题 ， 但 不 包括 近似 一 致 问题 。 这 些 工 作 的 结论 是 损毁 仅 能 被 概率 算法 (或 者 同步 算法 ) 容忍 。 
这 个 结果 不 能 被 增强 以 应 用 到 弱 初 始 死 进程 故障 模型 中 ， 可 以 通过 确定 一 致 性 和 初始 死 进程 
的 选举 算法 的 存在 性 来 证 明 这 一 点 。 随 机 化 也 有 所 帮助 。Bracha and Toueg[BT85] 提 出 的 随机 
一 致 性 算法 是 异步 算法 ， 能 容忍 1 < NW2 个 损毁 进程 ， 或 者 ! < N/3 个 Byzantine 进 程 。 

第 15 章 研究 了 同步 系统 中 能 够 达到 的 健壮 性 。 不 同 于 在 异步 模型 中 ， 进 程 的 损毁 可 以 通 
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过 其 余 进 程 检测 ， 因 为 正确 进程 的 有 限 响应 时 间 可 以 得 到 保证 。 从 而 可 以 达到 更 高 一 级 的 健 
壮 性 ， 这 可 以 通过 按照 脉冲 运行 的 系统 的 理想 模型 来 证 明 (参见 第 12 章 )。 确 定性 算法 可 以 容 
Wat < N/3 个 Byzantine 进 程 ，+ < N 个 损毁 进程 ， 如 果 对 消息 的 鉴定 是 可 能 的 ， 则 可 以 容忍 < N 
个 Byzantine 进 程 。 这 个 结果 和 第 14 章 的 不 可 能 性 的 结果 表明 ， 对 于 完全 异步 网 络 ， 不 存在 健 
壮 同 步 器 。 在 有 限 同 步 (有 物理 时 钟 和 有 限 的 消息 -延迟 时 间 ) 的 系统 中 实现 脉冲 模型 ， 要 求 
时 钟 精确 同步 。 这 是 第 15 章 其 余部 分 所 要 讨论 的 主题 。 

第 16 章 讨论 故障 检测 ， 这 是 加 强 计算 模型 的 另 一 种 方法 ， 就 像 同步 ， 通 常 在 分 布 式 系 统 
中 以 某 种 形式 可 用 。 正 如 入 们 可 以 比较 各 种 同步 模型 ， 从 中 发 现 解决 问题 的 所 必要 的 需求 。 
为 了 解决 一 致 性 问题 ， 我 们 可 以 研究 故障 检测 模型 ， 从 而 了 解 输出 必须 如 何 精确 反映 实际 的 
故障 。 


13.2.4 本 书 中 没有 涉及 的 主题 


第 14 章 和 第 15 章 中 给 出 的 结果 表明 ， 在 分 布 式 系统 中 可 实现 的 健壮 程度 。 许 多 问题 和 结 
果 仍 然 有 待 进一步 研究 ， 以 下 我 们 给 出 其 中 的 一 些 ， 并 给 出 一 些 参考 文献 的 线索 。 

(1) 同步 假设 的 精细 化 ”本 书 中 ， 只 考虑 了 完全 异步 和 完全 同步 的 系统 ， 这 些 系统 在 它 
们 可 实现 的 健壮 性 方面 差异 相当 大 。Dolev、Dwork、 Lynth and Stockmeyer[DDS87], 
[DLS88] 在 对 同步 作 了 中 等 假设 之 下 ， 研 究 了 系统 的 容错 性 。 

(2) 可 解 任务 的 确定 性 ”本 书 中 ， 展 示 了 某 些 任 务 的 可 解 性 ， 以 及 其 他 任务 的 不 可 解 性 。 
Biran, Moran and Zaks[BMZ90] 给 出 了 可 解 问题 和 不 可 解 问题 的 精确 特征 描述 。 

(3) 容错 的 复杂 度 ”除了 判定 哪些 任务 是 可 解 的 ， 也 可 能 要 研究 对 于 可 解 任务 ， 协 议 所 
消耗 的 计算 资源 量 。 考 虑 了 几 种 复杂 度 的 度量 : 消息 复杂 度 ， 位 复杂 度 和 时 间 复 杂 度 (EE 
中 常常 称 为 循环 复杂 度 )。 在 文献 [BGP92] 中 ， 可 以 找到 一 些 结果 的 综述 和 同时 满足 几 个 下 界 
的 一 致 性 协议 。 

(4) 动态 系统 和 组 员 资 格 ”本 书 中 ， 假 设 进程 的 集合 是 固定 (静态) 和 已 知 (尽管 某 些 
进程 可 能 失效 ) 的 。 进 程 的 静态 集合 适合 于 必须 可 靠 地 运行 固定 的 、 有 限 的 时 间 的 应 用 。 例 
如 ， 航 天 器 控制 系统 ， 其 中 修复 和 重新 配置 离线 进行 。 对 于 一 段 不 确定 的 持续 时 间 (例如 ， 
在 操作 系统 中 ， 或 者 在 空中 交通 控制 系统 中 )， 系 统 的 容错 操作 要 求 进程 能 被 修复 ， 且 进程 集 
能 被 在 线 重新 配置 ， 即 ， 不 停止 应 用 。 通 过 执行 组 员 资 格 协议 ， 重 新 配置 进程 集合 ， 在 协议 
中 ， 活 动 进程 与 系统 中 的 进程 集合 达成 一 致 。 关 于 这 些 协 议 及 其 参考 文献 参见 [RBS92]。 

(5) 利用 共享 变量 进行 通信 ”本 书 中 ,考虑 通过 消息 传递 进行 的 进程 间 的 通信 。 有 些 作 
者 研究 了 分 布 式 系统 的 容错 问题 ， 系 统 中 的 通信 是 基于 共享 变量 ， 参 见 Taubenfeld and 
Moran[TM89]。 . 

(6) 无 等 待 的 同步 ”一 种 更 复杂 的 通信 模型 是 进程 可 以 共享 任意 对 象 ， 而 不 是 寄存 器 。 
在 这 种 模型 中 ， 进 程 之 间 所 期 望 的 交互 可 以 根据 对 象 的 方法 形式 化 地 表示 ， 算 法 的 问题 被 形 
式 化 ， 作 为 对 象 的 实现 。 对 于 哪个 对 象 能 够 被 实现 ， 哪 个 对 象 不 能 被 实现 存在 广泛 的 理论 ， 
参见 [AW98]。 


13.3 稳定 算法 
即使 发 生 了 故障 ， 但 故障 数量 有 限 ， 且 通常 必须 精确 知道 故障 模型 ， 健 壮 算 法 也 一 直 显 
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示 出 正确 的 协同 行为 。 容 错 的 第 二 种 方法 ， 稳 定 算法 却 不 同 。 它 允许 任何 数目 的 任意 类 型 的 
故障 ， 但 是 算法 的 正确 行为 被 挂 起 ， 直 到 故障 修复 后 的 某 一 时 间 。 稳 定 算法 (有 时 也 称 自 一 稳 
Z) 可 从 任何 系统 配置 开始 ， 最 终 达 到 允许 的 状态 ， 并 按照 从 那 时 起 的 规范 运行 。 因 此 ， 临 
时 性 故障 影响 逐渐 消失 ， 无 需 始终 如 一 地 初始 化 系统 。 

第 17 章 研究 了 稳定 算法 。 早 在 1974 年 [Dij74] 就 引入 了 稳定 化 的 概念 。 并 把 它 应 用 于 算法 
中 ， 以 实现 在 由 处 理 器 组 成 的 环 上 的 互 斥 。 讨 论 这 些 算法 的 原因 是 由 于 它们 的 历史 价值 以 及 
它们 是 一 流 的 和 见解 深刻 的 。 本 书 中 前 面 所 解决 的 许多 问题 存在 稳定 解 ， 例 如 ， 数 据 传输 、 
选举 、 路 由 表 计 算 和 深度 优先 查找 树 。 

健壮 算法 和 稳定 算法 

稳定 算法 可 以 提供 保护 以 避免 所 谓 的 畔 时 故障 (transient failure)， 即 系统 组 件 中 的 暂时 
错误 行为 。 当 物理 条 件 暂 时 达到 极限 值 时 ， 这 些 故障 可 能 在 分 布 式 系统 的 许多 部 分 发 生 ， 包 
括 存储 器 和 处 理 器 的 错误 行为 。 例 如 ， 当 大 量 宇宙 射线 击 中 太空 船 时 ， 它 的 控制 系统 就 会 受 
到 影响 ， 同 时 系统 中 的 许多 组 件 就 会 受到 灾难 性 的 破坏 。 当 条 件 恢复 到 正常 时 ， 进 程 按照 程 
序 恢复 运行 , 但 由 于 它们 的 暂时 错误 行为 ， 全 局 状态 (配置 ) 可 能 成 为 任意 一 种 状态 (配置 )。 
稳定 性 质保 证 了 收敛 到 所 要 求 的 行为 。 

健壮 算法 提供 保护 以 避免 有 限 数量 组 件 的 永久 性 故障 (permanent failure )。 在 系统 修复 
和 重新 配置 过 程 中 ， 幸 存 的 进程 维持 着 正确 (尽管 可 能 不 是 十 分 有 效 ) 的 行为 。 因 此 ， 当 服 
务 的 暂时 中 断 是 不 可 接受 的 时 候 ， 必 须 利 用 健壮 算法 。 

Gopal and Perry[GP93] 和 Anagnostou and Hadzilacos[AH93] 所 发 表 的 文章 ， 研 究 了 健壮 且 
稳定 的 算法 。Gopal 和 Perry 的 研究 表明 ， 如 何 将 健壮 协议 进行 自动 修改 (编译 )， 使 它 变 成 既 
健壮 又 稳定 的 协议 。Anagnostou 和 Hadzilacos 说 明 不 存在 选举 和 计算 环 规模 的 健壮 且 稳定 的 算 
法 ， 并 提供 了 赋 给 不 同名 字 的 一 种 (随机 的 ) 协议 。 
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第 14 章 异步 系统 中 的 容错 


本 章 研究 异步 分 布 式 系 统 中 判定 问题 的 可 解 性 。 研 究 结 果 是 以 14.1 节 Fischer、Lynth and 
Paterson[FLP85] 提 出 的 基本 结果 为 顺序 排列 的 。 并 对 一 类 判定 问题 不 可 能 性 的 证 明 做 了 系统 
阐述 ， 结 果 也 被 看 作 是 一 些 假设 ， 这 些 假设 将 判定 问题 的 解 排 除 在 外 。 放 实 假 设 ， 使 得 获得 
各 种 问题 的 实际 解 成 为 可 能 ， 正 如 在 后 续 的 几 节 中 表明 的 那样 。 也 可 在 14.1.3 小 节 看 到 进一步 
的 讨论 。 


14.1 一 致 性 的 不 可 能 性 


在 本 节 ， 给 出 了 Fischer、Lynth and Paterson{[FLP85] 提 出 的 林 本 定理 的 证 明 ， 该 定理 谓 明 
不 存在 异步 、 确 定 的 、1- 损 毁 、 健 壮 的 一 致 性 协议 。 通 过 对 算法 的 公平 执行 序列 的 推理 来 证 
明 这 个 结果 。 我 们 首先 引入 一 些 表示 方法 (除了 2.1 节 引入 的 表示 方法 之 外 )， 并 给 出 在 后 续 
几 节 中 可 用 的 一 些 基 本 结果 。 


14.1.1 囊 示 .定义 及 基本 结果 


事件 中 的 序列 o = (e1, .., &) 在 配置 y? 中 是 可 应 用 的 ， 如 果 e' 在 配置 y 中 是 可 应 用 的 ，e: 在 
配置 ev (y) 中 是 可 应 用 的 等 等 。 如 果 最 终 得 到 的 配置 为 5， 则 我 们 将 它 记 为 y ~ 6 或 者 o(Y) =ð, 
使 得 从 7Y 到 6 中 的 事件 是 显 式 的 。 如 果 S C P 且 o 只 包含 5 的 进程 中 的 事件 ， 我 们 也 记 作 y ~ ;6。 

命题 14.1 设 序列 和 ,在 配置 Y 中 是 可 应 用 的 ， 且 不 存在 进程 ， 同 时 出 现在 序列 Oi 和 0 
中 。 那 么 ，02 在 配置 Oo1()) 中 是 可 应 用 的 ，01 在 配置 02(7) 中 是 可 应 用 的 ， 且 0 (0, (7)) =oi (az 
(y)). 

证 明 。 不 断 应 用 定理 2.19 可 得 结论 。 o 

进程 Pp 有 一 个 只 读 的 输入 变量 x,， 一 个 只 写 一 次 的 输出 寄存 器 y,， 它 的 初始 值 为 ?。 对 于 每 
个 进程 P， 输 入 配置 完全 由 zo 的 值 决定 。 通 过 将 值 写 人 中 ， 进 程 p 可 以 对 值 进行 判定 (通常 为 
0 或 1) ， 初 始 值 2 不 是 一 个 判定 值 。 假 设 正确 进程 在 公平 执行 中 ， 执 行 无 限 多 的 事件 。 为 此 ， 
一 个 进程 总 是 能 够 执行 一 个 内 部 事件 〈 可 能 为 void ) 。 

定义 14.2 “在 + 损毁 的 公平 执行 中 ， 至 少 有 N-t 个 进程 执行 无 限 多 的 事件 ， 且 发 送 给 正确 
进程 的 每 条 消息 被 接收 。( 进 程 是 正确 的 ， 如 果 它 执行 无 限 多 的 事件 。) 

算法 能 够 处 理 的 错误 进程 的 最 大 数 称 为 算法 的 弹性 (resilience ) ， 总 是 用 ! 表 示 。 本 节 中 ， 
证 明了 不 存在 弹性 为 1 的 异步 、 确 定 算法 。 

定义 14.3 ”一 个 1- 损 裔 -健壮 的 一 致 算法 ， 满 足以 下 三 个 要 求 。 

(1) 终止 性 在 每 个 1- 损 席 的 公平 执行 中 ， 所 有 正确 进程 进行 判定 。 

(2) 一 致 性 ”在 一 个 可 达 的 配置 中 ， 如 果 对 于 正确 进程 Pp 和 q，ybb 且 yb， 那 么 ， yp = 


(3) 非 平凡 性 对 于 "= 0 和 v = 1， 存 在 可 达 配 置 ， 在 这 个 配置 中 ， 对 于 某 些 PP， y= 
对 于 v = 0、1， 称 配置 是 判定 的 〈v-decided) ,如果 对 于 某 些 p，y, = v。 称 配置 为 判定 
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的 ， 如 果 它 是 0- 判 定 的 或 者 1- 判 定 的 。 在 一 个 v- 判 定 的 配置 中 ， 某 些 进程 已 对 v 判 定 。 称 配置 
是 vy- 价 的 (vy-valent)， 如 果 从 该 配置 可 达 的 所 有 判定 配置 是 v- 判 定 的 。 称 配置 是 双 价 的 
(bivalent)， 如 果 从 读 配 置 可 术 0- 判 定 和 1- 判 定 配置 。 称 配置 是 单价 的 (univalent)， 如 果 该 配 
置 是 1- 价 的 或 者 0- 价 的 。 在 单价 配置 中 ， 尽 管 进 程 还 没有 必要 进行 判定 ， 但 是 最 终 判 定 已 经 隐 
含 地 确定 。 

称 t- 健 壮 协 议 的 配置 x 是 分 支点 (fork)， 如 果 存 在 至 多 ! 个 进程 的 集合 T， 以 及 配置 % 和 Yi， 
WEY ~r Yorn, Hrv. EERE., REDEA, WRAN TERET 
执行 一 次 上 判定 以 及 一 次 0- 判 定 。 以 下 命题 请 明 ， 在 任何 时 刻 ， 至 多 ! 个 进程 的 损毁 一 定 被 其 
余 进 程 救 活 。 

命题 14.4 ”对 于 t- 健 壮 算法 的 每 一 可 达 配 置 ， 以 及 至 少 N-t 个 进程 组 成 的 子 集 5， 存 在 一 个 
判定 的 配置 68， 满足 7 ~>y 6。 

证 明 。 设 Yy 和 5 如 上 所 述 ， 考 虑 达到 配置 y 的 一 次 执行 ， 该 执行 包含 5 中 每 个 进程 的 无 限 多 
个 事件 ，( 此 后 进程 中 每 一 步 都 在 8 中 )。 这 个 执行 是 上 -损毁 公平 的 ， 并 且 S 中 的 进程 是 正确 的 ， 
因此 它们 可 达 判 定 。 o 

5114.5 不 存在 可 达 的 分 支点 。 

证 明 。 设 是 可 达 的 配置 ，7 是 至 多 ! 个 进程 的 一 个 子 集 。 

设 5 是 7 的 补 集 ， 即 5 = PT。3 有 至 少 N-! 个 进程 ， 因 此 存在 一 个 判定 的 配置 6， 满足 y~2>y 6 
(命题 14.4)。 配 置 6 或 者 是 0- 判 定 的 ， 或 者 是 1- 判 定 的 。 不 妨 假设 它 是 0- 判 定 的 。 

现在 证 明 ， 对 于 非 1- 价 的 配置 7"，y~*r Y。 设 /是 任 一 配置 ， 满 足 ~>r y。 因 为 在 S 和 7 中 
的 步 是 可 交换 的 (命题 14.1)， 存 在 配置 6， 从 6 和 7 都 可 达 。 由 于 6 是 0- 判 定 的 ， 因 此 6 也 是 0- 
判定 的 ， 这 表明 y' 不 是 1- 价 的 。 o 


14.1.2 不 可 能 性 证 明 


首先 我 们 利用 问题 的 非 平凡 性 证 明 ， 存 在 双 价 的 初始 配置 ( 引 理 14.6)。 随 后 ， 将 要 证 明 ， 
从 双 价 配置 开始 的 每 一 个 激活 步 不 需 迁移 到 单价 配置 中 就 可 以 执行 ( 引 理 14.7)。 这 足以 证 明 
一 致 性 算法 的 不 可 能 性 (定理 14.8)。 接 下 来 ， 设 4 是 1- 损 毁 - 健 壮 的 一 致 性 算法 。 

引 理 14.6 存在 4 的 双 价 初始 配置 。 

证 明 。 因 为 4 是 非 平凡 的 (定义 14.3)， 存 在 可 达 的 0- 判 定 和 1- 判 定 配 置 。 设 % 和 6 是 初始 
配置 ， 满 足 v- 判 定 的 配置 从 65, 可 达 。 

ROAR =61， 则 初始 配置 是 双 价 的 ， 结 论 成 立 。 否 则 ， 存 在 初始 配置 % 和 y;， 满 足 从 % 可 达 
v- 判 定 配置 ， 且 % 和 在 某 个 进程 的 输入 中 不 同 。 考 虚 从 5 开始 ，61 结 束 的 初始 配置 序列 ， 在 
这 些 配置 中 ， 一 个 进程 中 的 下 一 个 初始 配置 与 上 一 个 初始 配置 不 同 。( 把 输入 位 一 个 接 一 个 其 

倒 过 来 可 得 该 序列 。) 从 序列 中 的 第 一 个 配置 开始 ， 可 达 0- 判 定 的 配置 ， 从 最 后 一 个 配置 5 ， 

可 达 1- 判 定 的 配置 。 因 为 从 每 个 初始 配置 ， 可 达 一 个 判定 的 配置 ， 可 以 将 所 描述 的 % 和 7 作为 
序列 中 的 两 个 后 续 配 置 。 设 p 是 % 和 7 不 向 的 进程 。 

考虑 在 m 中 开始 的 公平 执行 ， 在 执行 中 ，P 没 有 执行 任何 步 。 这 个 执行 是 1- 损 毁 公 平 的 ， 
并 且 达 到 判定 的 配置 6。 如 果 p 是 1- 判 定 的 ， 则 加 是 双 价 的 。 如 果 有 是 0- 判 定 的 ， 观 察 可 得 ， Yo 
和 Ym 仅 在 p 中 不 同 。 在 执行 中 ，p 没 有 执行 。 因 此 有 是 从 六 可 达 的 ， 这 证 明了 y 是 双 价 的 。( 和 更 精 
确 地 ， 从 是 可 达 配 置 8'，p' 和 6 仅 在 进程 p 的 状态 中 不 同 ， 因 此 PB' 是 0- 判 定 的 ) 口 
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为 了 构造 非 - 判 定 的 公平 执行 ， 我 们 必须 证 明 ， 每 个 进程 可 以 执行 一 步 ， 每 条 消息 可 被 接 
收 ， 且 不 需 强加 判定 。 设 一 步 * 表 示 接 收 和 处 理 一 条 特定 消息 ， 或 者 由 某 一 特定 进程 进行 的 自 
然 迁 移 〈 内 部 或 发 送 )。 根 据 该 步 发 生 时 进程 的 状态 ， 可 能 导致 不 同事 件 。 如 果 在 传输 中 ， 消 
息 的 接收 是 可 应 用 的 。 自 然 迁 移 步 总 是 可 应 用 的 。 

引 理 14.7 设 y 是 可 达 的 双 价 配置 ，s 是 Yy 中 进程 p 的 可 应 用 步 。 存 在 事件 序列 0， 满 足 8 在 0 
(站 中 是 可 应 用 的 ， 且 s (a (四 )) 是 双 价 的 。 

证 明 。 设 C 是 没有 应 用 *、 从 7 可 达 的 配置 的 集合 ， 即 C = {o(y): s 不 在 o 中 出 现 }。s 在 C 的 
每 个 配置 中 是 可 应 用 的 (回忆 s 只 是 一 步 ， 不 是 某 个 特定 事件 )。 

存在 C 中 的 配置 ao 和 cl， 满 足 v- 判 定 的 配置 是 从 s (a) 可 达 的 。 为 了 证 明 这 一 点 ， 按 照 y 
的 双 价 性 ， 对 于 vy = 0、1， 从 7y 可 达 v- 判 定 的 配置 B.。 如 果 p, EC ( 即 没 有 应 用 s 达 到 一 个 判定 
的 配置 )， 观 察 可 见 ，s (6) 仍然 是 v- 判 定 的， 因此 ， 选 择 a, =b WEB, EC ( 即 应 用 s 达 到 
一 个 判定 的 配置 )， 选 择 w 作 为 配置 ， 从 这 个 配置 ，s 被 应 用 。 

如 果 ao =a, s(a) 是 所 要 求 的 双 价 配置 。 进一步 假设 ao # al ， 考 虑 从 7 到 ao 和 wi 的 路 径 
上 的 配置 。 称 这 些 路 径 上 的 两 个 配置 为 近邻 ， 如 果 其 中 一 个 配置 经 过 一 步 达到 另 一 个 配置 。 
因为 0- 判 定 的 配置 从 s( a) 可 达 ，1- 判 定 的 配置 从 s( o ) 可 达 ， 由 此 可 得 

(1) 存在 路 径 上 的 配置 y/， 满足 s(y') 是 双 价 的 ; 或 

(2) 存在 近邻 % 和 i， Wes (yo) 是 0- 价 的 ，s(y;) 是 1- 价 的 。 

在 第 一 种 情况 下 ，s(y') 是 所 要 求 的 双 价 配置 ， 结 果 得 证 。 在 第 二 种 情况 下 ，yp 和 中 有 
一 个 是 分 支点 ,矛盾 。 不 妨 假 设 从 % 经 一 步 而 得 y,， 即 对 于 进程 g 中 的 事件 e; yi = ely). IM 
在 s(e(%)) 是 s(y,)， 因 此 它 是 1- 价 的 ， 但 这 不 是 e(s( yo)) 为 1- 价 的 情形 ， 因 为 *( 和) 已 经 是 
0- 价 的 。 因 此 ，e 和 5 不 进行 交换 ， 这 蕴含 着 (定理 2.19) p = g， 但 可 达 的 配置 满足 hh ~, s 
(y) 且 % ss(e(j))。 由 于 前 者 是 0- 价 的 ， 后 者 是 1- 价 的 ， 加 是 分 支点 ， 这 是 一 个 矛盾 。 噩 

定理 14.8 不 存在 异步 、 确 定性 的 、1- 损 毁 - 健 壮 的 一 致 性 算法 。 

证 明 。 假 设 存在 这 样 的 算法 ， 从 双 价 初始 配置 开始 ， 可 以 构造 非 - 判 定 的 公平 执行 。 

直到 配置 %， 构 造 才 完 成 。 此 时 为 选择 一 个 可 应 用 步 ， 它 已 经 被 保持 可 用 了 最 长 的 可 能 
的 步 数 。 由 前 述 引 理 ， 以 这 样 一 种 方式 ， 即 ，si 被 执行 且 可 达 双 价 配 置 %,,， 对 执行 进行 扩展 。 

构造 给 出 了 一 个 无 限 公平 执行 ， 在 这 个 执行 中 ， 所 有 进程 都 是 正确 的 ， 但 是 从 未 进行 判 





定 。 


14.1.3 讨论 














结果 说 明 ， 对 于 一 致 性 问题 ， 不 存在 异步 、 确 定性 的 、1- 损 毁 - 健 壮 判定 算法 ， 这 不 包含 
一 类 非 -平凡 问题 的 算法 (参见 13.2.2 节 )。 

幸运 的 是 ，Fischer、 Lynch 和 Paterson 的 结果 所 基于 的 某 些 隐 含 假设 可 以 显 式 化 ， 其 结果 
对 于 任何 假设 的 弱化 是 十 分 敏感 的 。 尽 管 结果 具有 不 可 能 性 ， 但 甚至 在 异步 系统 中 和 进程 可 
能 发 生 故 障 的 地 方 ， 许 多 非 平凡 问题 仍 的 确 有 解 。 

(1) 弱 故 障 模型 “14.2 节 考虑 初始 死 进程 的 故障 模型 ， 它 比 损毁 模型 要 弱 。 在 该 模型 中 ， 
一 致 性 问题 和 选举 问题 确定 可 实现 。 

(2) BWA 与 一 致 性 问题 相 比 ，14.3 节 考虑 的 问题 ， 对 于 进程 之 间 的 协同 要 求 较 弱 。 并 
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(3) 随机 化 14.4 节 考虑 了 随机 协议 ， 协 议 中 对 终止 性 要 求 充分 放松 ， 使 得 即使 在 出 现 
Byzantine 故 障 时 ， 问 题 也 是 可 解 的 。 

(4) BALM 14.5 节 考虑 了 另 一 种 对 终止 性 要 求 的 放宽 ， 即 仅 当 给 定 进 程 正确 时 ， 才 要 
求 它 的 终止 性 。 同 时 ，Byzantine 健 壮 解 也 是 可 能 的 。 

(5) 同步 在 第 15 章 进一步 研究 了 同步 的 影响 。 

如 果 略 去 定义 14.3 中 的 三 个 要 求 之 一 ， 也 可 能 得 到 相当 平凡 解 。 参 见习 题 14.1。 在 习题 
14.2 中 ， 研 究 了 省 略 所 有 输入 组 合 都 是 可 能 的 这 样 一 个 假设 〈 引 理 14.6 的 证 明 中 陷 含 地 使 用 了 
该 假设 )。 


14.2 初始 死 进程 


在 初始 死 进程 模型 中 ， 在 执行 一 个 事件 之 后 ， 进 程 不 能 发 生 故 障 。 因 此 ， 在 一 个 公平 的 
执行 中 ， 每 个 进程 或 者 执行 0 个 事件 ， 或 者 执行 无 限 多 个 事件 。 ' 

定义 14.9 “在 -初始 死 进程 的 一 次 公平 执行 中 ， 至 少 有 N-1 个 进程 是 活动 的 ， 每 一 个 活动 
进程 执行 无 限 多 个 事件 ， 发 给 正确 进程 的 每 条 消息 被 接收 到 。 

在 :初始 死 进程 健壮 的 一 致 算法 中 ， 每 个 正确 进程 在 每 个 +- 初始 死 进程 公平 执行 中 进行 判 
定 。 它 的 一 致 性 和 非 平凡 性 的 定义 如 同 损毁 模型 。 

因为 在 发 送 一 条 消息 之 后 ， 进 程 不 会 发 生 故 障 。 对 于 等 待 接收 进程 p 的 消息 的 进程 ， 如 果 
它 知道 进程 p 已 经 发 送 了 至 少 一 条 消息 ， 则 它 是 安全 的 。 将 要 证 明 ， 只 要 发 生 故障 的 进程 占据 
少数 (+ < N/2)， 在 初始 死 进程 模型 中 ， 一 致 算法 和 选举 算法 都 是 可 解 的 。 大 量 的 初始 死 进程 
不 能 被 容忍 (参见 习题 14.3 ) 。 

1. 正确 进程 子 集 上 的 一 致 性 

在 Fischer、Lynch and Paterson[FLP85] 提 出 的 第 一 个 算法 中 ， 每 个 正确 进程 都 计算 正确 进 
程 的 司 一 个 集合 。 算 法 的 弹性 为 L(N-1)/2|。 设 L 代 表 『「(N+1)/21， 可 见 ， 至 少 有 L 个 正确 进程 。 
算法 分 两 个 阶段 执行 ， 参 见 图 14-1 所 示 的 算法 。 


var Succp, Alivep, Revd, : sets of processes init Ø ; 


begin shout (name, p) ; 
(* that is: forall q € P do send (name, p) to q *) 
while #Succ, < L 
do begin receive (name, q) ; Succ := Succ, U {q} end ; 
shout (pre, p, Succ, ) ; 
Alivey := Succy ; 


while Alive, Z Revd, 
do begin receive (pre, g, Succ) ; 
Alivep := Alivep U Succ U {q} ; 
Revdy := Revdp U {q} 
end ; 
Compute a knot in G 





图 14-1 结 的 计算 算法 
可 见 ， 进 程 向 它们 自己 发 送 消息 ， 在 许多 健壮 性 算法 中 就 是 这 样 做 的 。 在 这 里 以 及 其 余 
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部 分 ， 设 操作 “shout <mes>” 代 表 
forall q € P do 发 送 <mes> Fig 


进程 通过 发 出 它们 的 标识 (在 消息 <name，p> 中 )， 并 等 待 接收 L 条 消息 ， 来 构造 有 向 图 
G. 和 于 笃 几 有 L 个 正确 过 各 每 个 正确 进程 接收 足够 多 的 消息 来 完成 这 部 分 计算 。 在 图 G 中 p 
的 后 继 是 节点 g， 从 该 节点 进程 p 接 到 消息 <name，g>。 

初始 死 进 程 即 没 有 发 送 也 没有 接收 任何 消息 ， 因 此 形成 G 中 的 一 个 孤立 节点 。 正 确 进程 有 
LZ 个 后 继 ， 因 此 不 是 孤立 的 。 结 是 一 个 没有 输出 边 的 强 连通 分 量 ， 至 少 包含 两 个 节点 。G 中 存 
在 包含 正确 进程 的 结 。 因 为 每 个 正确 进程 出 度 为 L， 这 个 结 的 大 小 至 少 为 L。 因此 ， 当 2L > N 
时 ， 只 存在 一 个 结 ， 称 它 为 K。 最 后 ， 当 正确 进程 p» 有 LL 个 后 继 时 ， 至 少 会 有 一 个 后 继 属 于 kK。 
KAS aK POM AHR Ep att. 

因此 ， 在 算法 的 第 二 个 阶段 中 ， 进 程 构造 了 G 的 一 个 导出 子 图 ， 这 个 导出 子 图 至 少 包含 了 
它们 的 后 代 ， 并 从 它们 认为 是 正确 的 每 个 进程 ， 接 收 后 继 的 集合 。 因 为 进程 发 送 - -条 消息 后 ， 
不 会 发 生 故 障 ， 在 这 一 阶段 ， 不 会 出 现 死 锁 。 进 程 p 等 待 接收 g 的 消息 ， 仅 当 在 第 一 阶段 中 ， 
大 这 得 忆 经 搂 收 到 了 表明 4 是 正确 的 <name， 4> 消 息 。 

-- H R 14- PROTRAE, 每 个 正确 进程 已 经 接收 到 它 的 每 个 后 代 的 后 继 和 集合， 并 人 允 
许 计算 G 中 的 惟一 结 

2. 一 致 性 和 选举 问题 

当 所 有 正确 进程 正确 进程 的 结 达成 一 致 后 ， 选 择 进程 则 是 平凡 的 。& 中 具有 最 大 标识 的 进 
程 被 选 上 。 同 时 也 容易 取得 一 致 性 。 每 个 进程 同 它 的 后 继 、 输 入 (x) 一 起 进行 广播 ， 计 算 k 之 
后 ， 进 程 对 某 个 值 进行 判定 ， PAIR ASE 一 个 函数 (例如 ， 更 经 常 出 现 的 -- 个 值 ， 在 
平局 的 情况 下 为 0)。 

结 协议 算法 ， 到 第 法 以 及 选举 算法 要 交换 OU 条 消息 ， 其 中 一 条 消息 可 能 包含 有 上 个 
进程 名 的 一 张 表 。 更 有 效 的 选举 算法 已 被 提出 。Itai 等 人 [IKWZ90] 给 出 了 消息 复杂 度 为 O(N 
(t+log N) ) 的 一 个 算法 ， 并 证 明了 O(N (t+log N) ) 是 一 个 下 界 。Masuzawa 等 人 [MNHT89] 考 虑 
了 县 有 方向 侦 听 的 团 上 的 问题 ， 并 提出 了 消息 复杂 度 为 O(ND 的 算法 ， 这 是 一 个 最 优 算法 。 

选择 正确 进程 作为 领导 人 的 任何 选举 算法 也 可 以 解 一 致 性 问题 。 领 导 人 将 它 的 输入 进行 
广播 ， 所 有 正确 进程 对 其 进行 判定 。 因 此 ， 上 述 提 到 的 上 界 ， 对 于 初始 死 进程 的 一 致 性 问题 
间 样 成 立 。 然 而 ， 领 导 人 的 可 用 性 并 不 有 助 于 解决 一 致 性 问题 。 在 广播 它 的 输入 之 前 ， 领 导 
人 自身 也 可 能 损毁 。 此 外 ， 正 如 下 一 节 中 所 表明 的 ， 损 毁 模型 并 不 能 解决 选举 问题 。 

14.3 确定 可 实现 实例 

到 目前 为 止 研 究 的 一 致 性 问题 ， 要 求 每 个 进程 对 同一 个 值 判定 。 本 节 研 究 的 任务 可 解 性 ， 
对 进程 之 间 的 密切 协同 要 求 较 少 。 在 14.3.1 小 节 ， 给 出 了 一 个 实际 问题 的 解决 方法 ， 即 ， FARE 
小 的 命名 空间 ， 对 进程 集合 进行 重 命名 。 在 14.3.2 小 节 ， 将 之 前 给 出 的 不 可 能 性 的 结果 扩展 到 
更 大 一 类 的 判定 问题 上 。 

用 可 能 的 输入 集合 X 和 输出 集合 D 描 述 分 布 式 任务 ， 一 个 (可 能 是 部 分 ) 映射 


T: X 一 刀 (DNm 
RITER, WEE I = (x, ..., xy ) 代 表 进 程 的 输入 ， MAT (x ) 是 算法 的 合法 输出 集 








合 ， 用 判定 向 量 d = (d, .., dy ) 表 示 。 如 果 7 是 部 分 国 数 ， 那 么 并 不 是 每 个 输入 值 的 组 合 都 
是 允许 的 。 

定义 14.10 算法 是 任务 了 的 t- 损 贤 健壮 解 ， 如 果 它 满足 以 下 条 件 。 

(1) 终止 性 在 每 次 -损毁 的 公平 执行 中 ， 所 有 正确 进程 进行 判定 。 

(2) 一 致 性 如 果 所 有 进程 是 正确 的 ， 判 定向 量 4 ET ) 中 。 

一 致 性 条 件 绚 含 着 ， 进 程 的 子 集 进行 判定 的 那些 执行 中 ， 判 定 的 部 分 向 量 总 是 可 以 扩展 
AT (x ) 中 的 向 量 。 集 合 Dr 表 示 所 有 输出 向 量 的 集合 ， 即 7 的 值 域 。 

(1) 例子 : 一 致 性 问题 。 一 致 性 问题 要 求 所 有 判定 相等 ， 即 

Don = {(0,0,...,0),(0,1,....)} 
(2) WF: 选举 问题 。 选 举 问题 要 求 一 个 进程 对 1 判定 ， 其 他 进程 对 0 判定 ， 即 
De = {(1,0,...,0),(0,1,...,0),...,(0,0,...,1)} 


(3) AF: 近似 一 致 性 问题 。 在 E- 近 似 一 致 性 问题 中 ， 每 个 进程 有 一 个 真实 的 输入 值 ， 
[445] 并 对 真实 的 输出 值 进行 判定 。 要 求 任意 两 个 输出 值 之 间 的 最 大 差 至 多 为 z。 
Do = {(d,».. dy): max(d,) — min(d,)< £} 


approx 
(4) 例子 : 重 命名 问题 。 在 重 命名 问题 中 ， 每 个 进程 具有 不 同 标识 ， 该 标识 取 自 一 个 任 
意 大 的 域 。 每 个 进程 必须 对 一 个 新 名 字 进 行 判定 。 新 名 字 的 定义 域 为 1，.…，K， 满 足 所 有 新 
名 字 不 同 。 
Doane =(d ond, )ii# j= d, = d } 


在 保持 顺序 (order-preserving) 的 重 命名 问题 中 ， 要 求 新 名 字 保 持 旧 名 字 的 顺序 ， 即 ,已 


< xj = d, < d,s 
14.3.1 可 解 问题 : 重 命名 


本 小 节 给 出 Attiya et al.[ABND* 90] 提 出 的 重 命名 算法 。 算 法 可 忍受 达到 1 < NM2 次 的 损毁 
(是 算法 中 的 参数 ) 且 在 大 小 为 K= (N-21 +1) 的 空间 中 命名 。 

1.t 的 上 界 , 

首先 表明 ， 没 有 一 个 重 命名 算法 能 够 忍受 W2 次 或 更 多 的 损毁 。 事 实 上 ， 几 乎 所 有 揭 筑 - 
健壮 算法 的 故障 数 极限 为 < W2， 以 下 的 证 明 也 适合 于 其 他 的 问题 。 

定理 14.11 不 存在 :> N/2 的 重 命名 算法 。 

证 明 。 如 果 t> N/2， 可 以 形成 两 个 不 相交 的 大 小 为 N-t 的 进程 组 和 T。 由 于 :个 进程 可 能 发 
生 故 障 ， 一 个 组 必须 能 够 对 “自己 的 组 ”进行 判定 ， 即 不 与 组 外 的 进程 进行 交互 (参见 命题 
144)。 因 此 ， 在 一 次 执行 中 ， 组 可 以 独立 地 完成 判定 。 证 明 的 关键 是 说 明 ， 这 些 判 定 是 相互 
不 一致 的 。 我 们 继续 证 明 重 命名 问题 的 例子 。 . 

由 命题 14.4， 对 于 每 一 个 初始 配置 7， 存 在 配置 k， 满 足 8 中 的 所 有 进程 已 经 判定 ， Ay~s 
56， 对 于 7 了， 类似 的 性 质 成 立 。 在 N-! 个 进程 的 组 内 的 算法 操作 .定义 了 从 N-! 个 初始 标识 组 成 
的 向 量 到 N-! 个 新 名 字 组 成 的 向 量 的 一 个 关系 。 因 为 初始 的 命名 空间 是 无 限 的 、 新 名 字 来 自 有 

限 域 ， 那 么 存在 不 相交 被 映射 到 重 登 的 输出 上 的 输入 。 即 存在 输入 向 量 (KAN-t) GG, 
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TAA AY, Wu + 六 ， 但 是 存在 相应 的 输出 向 量 4 和 z ， 对 于 某 些 ;Ej， 满 足 d; = ej。 

现在 ， 不 正确 的 执行 构造 如 下 。 初 始 配 置 7 在 组 S 中 的 输入 为 ， 在 组 T 中 的 输入 为 5 。 观 
察 可 见 ， 所 有 初始 名 字 不 同 (在 这 两 个 组 之 外 的 初始 名 字 可 任意 选择 ) 。 设 or 是 步骤 的 序列 ， 
通过 这 些 步骤 ， 组 7 由 y 可 达 ， 在 配置 9 中，7 中 的 进程 已 经 对 名 字 z 进行 判定 。 由 命题 14.1， 
这 个 序列 在 配置 ys 中 仍然 是 可 应 用 和 的， 在 这 个 配置 中 ，5 中 的 进程 已 经 对 名 字 d 进行 判定 。 在 
or (ys) 中 ， 两 个 进程 已 对 同一 名 字 (因为 d = e;) 进行 判定 ， 这 表明 算法 不 是 - 一 致 的 。 g 

企 以 下 情况 下 ， 假 设 1 < W2。 

2. 重 命名 算法 

ERMER (图 14-2 所 示 的 算法 )， 进程 P 维 持 它 已经 看 到 的 进程 输入 的 集合 Vv， 初 
始 时 ，V;, 正 好 包含 x,。 每 次 p 接 收 的 输入 集合 中 有 新 的 输入 时 ， 就 对 V, 进 行 扩展 。 一 旦 开始 ， 
BERVEN EH, 向 所 有 近邻 发 关 它 的 集合 。 Hit, RAV AMAT HK, PNV A SR 
值 完 全 由 所 包含 的 输入 来 定 序 ， 此 外 多 包含 至 多 N 个 名 字 。 因 此 ， 进 程 p 向 所 有 近邻 发 送 它 的 
集合 至 多 N 次 ， 表 明 算法 终止 ， 且 消息 复杂 度 为 O(AM )。 








var Vp : set of identities ; 
Cp : integer ; 


begin Vp := {£p} ; cp := 0; shout (set, Vp) ; 


while true 
do begin receive (set, V }) ; 
if V = V, then 


begin cp := cp +1; 
if cp) = N — t and yp = b then 
(* Vp is stable for the first time: decide *) 
Yp := ( # Vp . rank(Vp. £p) ) 





end 
else if V C V, then 
skip (* Ignore “old” information *) 
else (* new input; update V, and restart counting *) 
begin if V, C V then cp := 1 else cp :一 0 
Vp := V, UV ; shout (set, Vp) 


end 





图 14-2 简单 重 命名 算法 


此 外 , 进程 p 还 对 已 经 接收 到 对 当前 集合 多 的 拷贝 的 次 数 进 行 计 数 (在 变量 c, 中 )。 初 始 时 、 
2 为 0， 每 当 接 到 包含 的 一 条 消息 时 ，cr 就 增加 。 消 息 <set， 几 的 接收 可 能 引起 多 增长 ， 须 
重新 设置 cv。 如 果 匈 的 新 值 与 V 相 等 〈 即 如 果 VY 是 旧 多 的 严格 超 集 )， 则 将 cv 设 为 1， 否 则 为 0。 

称 进程 p 达 到 稳定 集 Y， 如 果 当 W 的 值 是 Y 时 ，cr 变 成 W- 关 换 句 话说 ，p 已 经 第 N-/ 次 接 到 
多 的 当前 值 V。 

引 理 14.12 稳定 集 是 完全 有 序 的 、 即 如 果 g 达 到 稳定 集 Vi 和 r 达 到 稳定 集 V,、 那 么 Vi CY，， 
ARV GV, 

证 明 。 fe BeG BABE EV, BURP RV: XMS Bq EL AMN-1 BERLE BI A <set, 
Y>，/ 忆 经 从 N-! 个 进程 接收 到 消息 <set，V>。 因 为 2(N-1) > N， 至 少 存在 一 个 进程 p，g 和 / 
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AER BK Eset, Vi>Ai<set, V>. Alt, VIVRE PH, BOR SRE 
另 一 个 中 。 

引 理 14.13 在 每 炊 公 平 上 -损毁 的 执行 中 ， 每 个 正确 进程 至 少 到 达 一 个 稳定 集合 。 

证 明 。 设 p 是 正确 进程 集合 V, 只 能 被 扩展 ， 至 多 包含 N 个 输入 名 。 因 此 对 于 V, 可 达 最 大 
值 Y。。 进 程 p 向 所 有 近邻 发 送 这 个 值 ， 每 个 正确 进程 接 到 消息 <set，Vo>。 这 表明 ， 最 终 每 个 正 
确 进程 持 有 Vo 的 超 集 。 

然而 ， 这 个 超 集 不 是 严格 的 ， 否 则 ， 一 个 正确 进程 就 会 向 p 发 送 Vo 的 严格 超 集 。 这 与 Vo 的 
选择 矛盾 ( 因为 最 大 集合 总 是 被 p 保 存 )。 因 此 ， 每 个 正确 进程 q 在 执行 中 至 少 有 一 次 有 值 Y, = 
V。， 因 此 每 个 正确 进程 在 执行 中 向 p 发 送 消 息 <set，Vo>。 所 有 这 些 消息 在 执行 中 都 被 接收 ， 且 
VY 的 增加 从 不 会 超过 Vo。， 它 们 都 被 计数 ， 使 得 Vo 在 p 中 变 成 稳定 的 。 口 

一 且 首 次 到 达 稳 定 集合 Y， 进 程 p 就 对 (*，r) 进行 判定 ， 其 中 s 是 V 的 大 小 ，r 是 % 在 V 中 的 
次 序 。 从 N-! 个 进程 已 经 接收 到 稳定 集合 ， 因此 这 个 稳定 集合 至 少 包含 N-! 个 输入 名 字 ， 表明 
N-t<s<N。 在 大 小 为 的 集合 中 的 次 序 满足 1 <r< s。 于 是 ， 可 能 的 判定 数 为 K = Ss, 它 
的 值 为 (NW-w2)(1 +1)。 如 果 需 要 ， 也 可 用 从 数 对 到 范围 为 1，...，& 的 整数 的 固定 上 映射 (参见 习 
题 14.5 ) 。 

定理 14.14 图 14-2 所 示 的 算法 解决 了 输出 名 空间 大 小 为 = (N-1/2) (1 +1) 的 重 命名 问题 ， 

证 明 。 央 为 在 任何 公平 -损毁 的 执行 中 ， 每 个 正确 进程 到 达 一 个 稳定 集合 ， 每 个 正确 进程 
对 新 名 字 进 行 判定 。 为 了 证 明 所 有 新 名 字 者 不同， 考虑 进程 gq 和 /分别 可 达 的 稳定 集合 WV 和 六。 
如 果 集 合 大 小 不 同 ，g 和 7 的 判定 也 不 同 ， 因 为 这 个 大 小 包含 在 判定 中 。 如 果 和 集合 大 小 相等 ， 
那么 ， 由 引 理 14.12， 它 们 是 相等 的 。 因 此 4g 和 xr 在 集合 中 有 不 同 的 次 序 ， 再 次 表明 ， 它们 的 判 
定 是 不 同 的 。 o 

3. 讨论 

观察 可 见 ， 进 程 在 对 自己 的 名 字 进 行 判定 之 后 ， 并 不 能 使 图 14-2 所 示 的 算法 终止 。 算法 
继续 被 执行 ， 来 “帮助 ”其 他 进程 进行 判定 。Attiya[ABND* 90] 表 明 ， 这 是 必须 的 ， 因为 算法 
必须 处 理 这 样 一 种 情况 ， 即 ， 某 些 进程 执行 很 慢 ， 其 他 一 些 进程 已 经 执行 判定 后 ， 这 些 慢 进 
程 才 执行 它们 的 第 一 步 。 

根据 命名 空间 的 大 小 ， 这 里 提出 的 简单 算法 并 不 是 最 好 的 。Attiya at al [ABND* 90] 给 出 
了 一 个 更 复杂 的 算法 ， 所 赋 名 字 的 值 域 为 1 ，...，N+i。 下 一 小 节 蕴 含 着 损毁 健壮 重 命名 问题 ， 
它 的 新 名 字 空 间 大 小 的 下 界 为 N+1。 

Attiya 等 人 同时 提出 了 保持 次 序 的 重 命名 算 靶 。 重 命名 的 整数 的 域 为 1，.， K=2- (N-t 
+1)-1。 同 时 证 明了 这 是 上 损毁 、 健 壮 、 保 持 次 序 重 命名 算法 的 可 能 的 最 小 命名 空间 。 


14.3.2 扩展 的 不 可 能 性 结果 


Moran and WolfstahlIMW87] 将 一 致 性 问题 的 不 可 能 性 结果 推广 到 更 一 般 的 判定 问题 上 。 
任务 7 的 判定 图 是 图 Gr = (V, E), 其 中 V= DB 


E={(d.d4,): 4 和 区 只 有 一 个 分 量 不 同 } 


如 果 Gr 是 连通 图 ， 则 称 任务 T 是 连通 的 ， 否 则 称 它 是 不 连通 的 。 Moran 和 Wolfstahl 假 设 T 
的 输入 图 (定义 类 似 于 判定 图 ) 是 连通 的 ， 即 ， 如 同 在 引 理 14.6 证 明 的 中 ， 可 以 通过 逐一 改 
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变 进程 的 输入 ， 在 任意 两 个 输入 配置 之 间 转 移 。 此 外 ,证 明了 非 - 平 凡 算 法 的 不 可 能 性 结 采 ， 
非 - 平 凡 性 算法 是 这 样 的 算法 ， 它 除了 满足 (1) 终止 性 (2) 一 臻 性， 还 要 满足 (3) 非 - 平 
凡 性 。 对 于 每 个 EDr， 存 在 可 达 配 置 ， 在 这 个 配置 中 ， 进 程 已 经 对 d 进行 判定 。 

定理 14.15 对 于 不 连通 的 任务 T， 不 存在 非 -平凡 、1- 损 独 -健壮 判定 算法 。 


证 明 。 用 反 证 法 。 假 设 存在 这 样 的 算法 4， 从 它 可 导出 一 致 性 算法 A'， 由 定理 14.8， 这 构 
成 了 矛盾。 为 了 简化 证 明 过 程 ， 我 们 假设 Cr 包含 两 个 连同 分 量 ，“0” 和 “1"。 

算法 4' 首 先 模拟 算法 4， 而 不 是 对 值 4 进行 判定 ， 一 个 进程 向 所 有 近邻 发 送 消息 <vote，d>， 
并 等 待 接收 N-1 条 投票 消息 。 不 会 出 现 死 锁 ， 因 为 所 有 正确 进程 在 4 中 判定 ， 因 此 至 少 有 N-1 
个 进程 向 所 有 近邻 发 送 投票 消息 。 

接 到 消息 之 后 ， 进 程 p 持 有 Dx 中 向 量 的 N-1 个 分 量 。 用 没有 接 到 投票 的 进程 的 值 对 这 个 向 
量 进行 扩展 ， 按 照 这 种 方式 ， 整 个 向 量 在 Dr 中 。( 事 实 上 ， 这 个 进程 进行 一 致 性 判定 ， 或 者 这 
个 进程 仍然 只 是 可 能 进行 一 致 性 判定 。) 

观察 可 见 ， 不 同 进程 可 能 计算 不 同 扩展 ， 但 是 这 些 扩展 属于 Gr 的 同一 个 连通 分 量 。 接 到 
N-1 个 投票 的 每 个 进程 ， 对 扩展 向 量 所 属 的 连通 分 量 的 每 个 名 字 进 行 判定 。 这 仍然 可 以 表明 ， 
4 是 一 致 性 算法 。 

终止 性 上 述 已 经 证 明 ， 每 个 正确 进程 至 少 接 到 N-1 次 投票 。 

一 致 性 我 们 首先 证 明 ， 存 在 向 量 dEDr， 满 足 每 个 正确 进程 得 到 4 的 N-1 个 分 量 。 

情形 1: 所 有 进程 在 4 中 部 可 找到 一 次 判定 。 设 4 是 所 达 判 定 的 向 量 ， 每 个 进程 得 到 4 的 
N-1 个 分 量 ， 尽 管 每 个 进程 “丢失 的 ”分 量 可 能 不 同 。 

情形 2: 除了 一 个 进程 r 之 外 ， 所 有 进程 在 4 中 都 可 找到 一 次 判定 。 所 有 正确 进程 接 到 相同 
的 N-1 个 判定 ， 即 除了 r 以 外 的 所 有 那些 进程 。r 可 能 损毁 ， 但 也 可 能 由 于 r 只 是 慢 ， 因 此 /仍然 
可 能 达到 一 个 判定 ， 即 ， 存 在 向 量 4 ED;， 对 到 目前 为 止 的 判定 进行 扩展 。 

由 d, 的 存在 性 ， 可 得 每 个 进程 对 向 量 ad 的 连通 分 量 进行 判定 。 

非 ~ 平 凡 性 ”由 A 的 非 平 性 ， 可 达 分 量 0 和 分 量 中 1 的 判定 向 量 。 按 照 4' 的 构造 ， 两 种 判定 
都 是 可 能 的 。 

因此 ，4 是 一 个 异步 、 确 定性 的 、1- 损 毁 -健壮 的 一 致 性 算法 。 由 定理 14.8， 可 得 不 存在 
算法 4。 ， 

讨论 

非 -平凡 性 的 要 求 ， 规 定 Dr 中 的 每 一 个 判定 向 量 是 可 达 的 ， 这 是 相当 强 的 要 求 。 人 们 可 能 
会 问 ， 在 这 种 意义 上 平凡 的 算法 是 否 仍然 值得 考虑 。 作 为 一 个 例子 ， 考 虑 重 命名 图 14-2 所 示 
的 算法 ， 它 的 非 -平凡 性 并 不 明显 ， 即 ， 具 有 不 同名 字 的 每 个 向 量 是 可 达 的 。 甚 至 在 这 种 情况 
为 什么 对 非 -平凡 性 感 兴趣 也 不 太 清楚 。 

对 定理 14.15 的 证 明 的 考察 揭示 出 ， 在 证 明 中 可 用 较 弱 的 非 平凡 性 要 求 ， 即 ， 判 定向 量 至 
少 在 Gz 的 两 个 不 同 连通 分 量 中 是 可 达 的 。 这 种 弱 的 非 平凡 性 有 时 可 从 问题 的 陈述 导出 。 

当 有 一 个 处 理 器 出 现 故障 时 ，Biran、Moran and Zaks[BMZ90] 做 了 与 可 解 和 不 可 解 的 判 
定 任务 相关 的 一 些 基础 工作 。 他 们 给 出 了 可 解 判定 任务 的 完整 组 合 特性 。 
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14.4 概率 一 致 性 算法 


定理 14.8 的 证 明 表明 ， 每 个 异步 一 致 性 算法 有 无 限 次 执行 ， 在 这 些 执行 中 ， 不 发 生 判定 。 
吾 运 的 是 ， 对 于 精心 选择 的 算法 ， 这 样 的 执行 足以 少 到 概率 为 0， 这 使 得 算法 在 概率 意义 上 非 
常 实 际 ， 参 见 第 9 章 。 在 本 节 中 ， 我 们 提出 两 个 概率 一 致 性 算法 ， 一 个 用 于 损毁 模型 ， 另 一 个 
用 十 Byzantine 模 型 。 算 法 是 由 Bracha 和 Toueg[BT85] 提 出 的 。 在 两 种 情况 下 ， 首 先 假设 了 弹性 
(分 别 为 :< N/2 和 t < N/3) 的 上 界 ， 然 后 给 出 了 上 界 相 匹 的 两 个 算法 。 

在 这 些 概率 一 致 性 算法 的 正确 性 要 求 中 ， 终 止 性 要 求 被 概率 化 ， 即 用 弱 的 收敛 要 求 代替 
终止 性 要 求 。 

收敛 性 对 于 每 个 初始 配置 ， 


lim Pr[ 一 个 正确 进程 在 k 步 之 后 ， 还 未 判定 的 概率 ] = 0 
在 每 次 执行 中 ， 必 须 满足 部 分 正确 性 ( 一致 性 )。 所 得 概率 算法 就 是 Las Vegas 算 法 [9.1.2 小 


Ñl 

从 给 定 初始 配置 开始 的 所 有 执行 都 以 概率 进行 。 为 了 使 得 概率 具有 意义 ， 必 须 给 出 这 些 
执行 的 概率 分 布 。 可 以 在 进程 中 利用 随机 化 做 到 这 一 点 (如 在 第 9 章 )。 但 这 里 定义 了 消息 到 
达 的 概率 分 布 。 

通过 假设 公平 调度 (fair scheduling) 来 定义 从 给 定 初始 配置 开始 执行 的 概率 分 布 。 这 两 
个 算法 校 轮 井 作 。 在 一 轮 循环 中 , 一 个 进程 向 所 有 近邻 发 送 一 条 消息 ,并 等 待 接收 W-t 条 消息 。 
定义 R49，P, k) 为 第 k 轮 循环 的 事件 ， 进 程 p 接 收 前 N-! 条 消息 中 % 的 〈 第 k 轮 ) 消息 。 公 平 调 
度 意味 着 

(1) de>OVp,g,k:Pr[R(p.g,k)] >E 。 

(2) HFAA, ARDEP, q, r, HERC, p, k) WEER, r, k) 是 独立 的 。 

观察 可 见 ， 当 要 求 收敛 性 〈 以 概率 1 终止 ) 时 ， 命 题 14.4 对 于 概率 算法 也 成 立 。 因 为 能 够 
以 正 概率 到 达 可 达 配 置 。 从 每 一 个 可 达 配 置 ， 一 定 可 以 到 达 一 个 判定 的 配置 (尽管 不 必 在 每 
次 执行 中 都 达到 )。 


14.4.1 损毁 -健壮 一 致 协议 


本 节 假 设 在 损 筑 故 障 模型 中 ， 研 究 一 致 性 问题 。 首 先 证 明了 关于 弹性 的 一 个 上 界 t < N2, 
随后 给 出 了 弹性 为 :< MW2 的 算法 。 

定理 14.16 不 存在 > N/2 的 t- 损 锅 -- 健 壮 一 致 协议 。 

证 明 。 如 果 存 在 这 样 的 协议 P， 那 么 下 述 的 三 个 声明 成 立 。 

声明 14.17 P 有 双 价 初始 配置 。 

证 明 。 类 似 于 引 理 14.6 的 证 明 ， 详 细 证 明 留 给 读者 。 口 

对 于 进程 的 子 集 5， 称 配置 7 为 5- 双 价 的 ， 如 果 仅 执行 中 的 步 ， 从 配置 y 可 达 0- 判 定 配置 和 
-判定 配置 。 称 配置 y 为 5-0- 价 的 ， 如 果 仅 执行 5 中 的 步 ， 从 配置 y 可 达 0- 判 定 配置 但 不 能 达到 1- 
判定 配置 。 类 似 地 可 定义 S-1- 价 的 配置 。 

将 进程 分 为 两 组 ，S 和 了， 大 小 分 别 为 [N/2] 和 『N/2]。 

声明 14.18 对 于 可 达 配 置 /，y 或 者 是 S-0- 价 的 和 7-0- 价 的 ,或 者 是 S-1- 价 的 和 T.1- 价 的 。 

证 明 。 协 议 的 最 大 漳 性 草 含 ，S 和 7 都 可 独立 地 到 达 判 定 状态 。 如 果 允 许 进行 不 同 判定 ， 
那么 通过 组 合 调度 可 达到 不 一 致 的 配置 。 
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声明 14.19 P 没 有 可 达 的 双 价 配置 。 

证 明 。 设 给 定 可 达 的 双 价 配置 7， 不 妨 假设 是 3-1- 价 的 和 7-1- 价 的 (利用 声明 4.18)。 然 而 ， 
;是 双 价 的 ， 于 是 从 * 也 可 达 0- 判 定 配置 6 (明确 地 以 组 间 合 作 的 方式 )。 在 从 ?到 6 的 配置 序列 
中 ， 存 在 两 个 后 续 配置 和 yp， 其 中 X 即 是 5-v- 价 的 又 是 Tv- 价 的 。 设 p 是 引起 从 到 % 的 转移 的 
进程 。 现 在 p E 5 是 不 可 能 的 ， 因 为 y 是 5-1- 价 的 ，yo 是 $-0- 价 的 ， 类 似 地 ，p © 7 是 不 可 能 的 。 
这 是 一 个 矛盾 。 口 

由 声明 14.17 和 声明 14.19， 可 引起 与 协议 P 的 存在 性 的 矛盾 。 因 此 定理 14.16 得 证 。 口 

Bracha 和 Toueg 损 毁 - 健 壮 一 致 算法 “Bracha 和 Toueg 提 出 的 损毁 -健壮 一 致 算法 [BT85] 按 
照 轮 执行 : 在 第 k 轮 中 ， 进 程 向 所 有 进程 (包括 自己 ) 发 送 消 息 ， 并 等 待 接收 第 x 轮 的 N-1 条 消 
息 。 等 待 这 个 数目 的 消息 并 不 会 引入 死 锁 的 可 能 性 (参见 习题 14.10)。 

在 每 一 轮 中 ， 进 程 p 向 所 有 近邻 发 送 一 次 对 0 或 者 1 的 投票 ， 及 一 个 权 值 。 权 值 是 上 一 轮 中 
所 接 到 的 对 的 那个 值 的 投票 数 (在 第 一 轮 中 为 1)。 权 值 超过 M2 的 投票 称 为 证 据 。 尽 管 不 同 进 
程 在 一 轮 中 可 能 进行 不 同 投票 ， 然 而 在 一 轮 中 ， 不 会 存在 针对 不 同 值 的 证 据 ， 正 如 以 下 将 要 
表明 的 。 如 果 进 程 p 在 第 k 轮 中 接 到 一 个 证 据 ， 那 么 进程 p 在 第 k+1 轮 中 对 它 的 值 投 赞成 不 ， 否 
则 进程 p 对 接 到 的 大 部 分 投票 投 赞 成 票 。 如 果 在 一 轮 中 ， 收 到 多 干 :个 证 据 ， 就 进行 判定 。 经 
过 判定 的 进程 退出 主 循环 ， 并 在 下 两 轮 中 向 所 有 近邻 发 送 证 据 ， 以 便 使 得 其 他 进程 能 够 判定 。 
协议 如 图 14-3 所 示 的 算法 。 

对 于 到 达 稍 后 轮 的 投票 必须 在 适当 的 轮 中 处 理 ; 在 算法 中 ， 进 程 将 这 个 消息 发 向 自己 ， 
以 备 以 后 处 理 ， 来 对 以 加 以 模型 化 。 观 察 可 得 ， 在 任何 一 轮 中 ， 进 程 至 多 从 每 个 进程 接收 -- 
次 投票 ， 因 此 总 数 可 达 N-! 次 投票 。 因 为 向 所 有 近邻 发 送 投 票 的 进程 数 可 能 多 于 N-+， 进 程 可 
能 会 考虑 向 所 有 近邻 发 送 投票 的 不 同 子 集 。 我 们 随后 显示 算法 的 几 个 性 质 ， 它 们 一 起 蕴含 了 
算法 是 一 个 概率 损毁 ~ 健壮 一 致 性 协议 (定理 14.24)。 

引 理 14.20 在 任何 一 轮 中 ， 不 存在 两 个 进程 为 不 同 值 作证 。 

证 明 。 假 设 在 第 k 轮 中 ， 对 于 k > 1， 进 程 p 为 "作证 ， 进 程 g 为 w 作 证 。 因 为 在 第 1 轮 中 , 没 
有 进程 作证 。 假 设 蕴含 着 ， 在 第 -1 轮 中 ， 进 程 p 接 到 赞成 v 的 投票 数 超 过 N/2; PFGE Fl HK 
w 的 投票 数 超过 N/2。 票 数 加 起 来 超过 N。 因此 ping RAs Oe AE ROD, M 
在 进程 "， 向 2 发 送 " 投 票 ， 向 4 发 送 w- 投 票 。 这 昔 含 着 ，， = w。 口 

引 理 14.21 如 果 一 个 进程 判定 ， 那 么 至 多 两 轮 之 后 ， 所 有 正确 进程 对 同一 个 值 判定 。 

证 明 。 设 /表示 第 一 次 发 生 判 定 的 轮 数 ， 第 ki 轮 发 生 判 定 的 进程 为 p，* 是 p 的 判定 值 。 判 定 
列 含 着 在 第 k 轮 中 有 v- 个 证 据 ; 因此 由 引 理 14.20 可 得 ， 不 存在 其 他 值 的 证 据 ， 因此 在 第 k 轮 中 ， 
不 存在 不 同 判定 。 

在 第 k 轮 中 ， 为 v 作 证 的 证 据 多 于 个 (由 p 的 判定 而 得 )，、 因 此 ， 在 第 :元 中 ， 所 有 正确 进程 
至 少 接 到 一 个 v- 证 据 。 因 此 ， 在 第 K+1 轮 投票 的 所 有 进程 答 成 v (同时 p 仍 然 在 第 t+1 轮 向 所 有 
近邻 发 送 一 张 票 )。 这 蕴含 着 ， 如 果 在 第 k+1 轮 的 确 进行 判定 ， 那么 这 个 判定 就 是 对 v 的 判定 。 

在 第 k+1 轮 中 ， 仅 有 v- 投 票 被 提交 ， 因 此 在 第 k+2 轮 投票 的 所 有 进程 在 那 一 轮 为 v 作 证 ( 进 
程 p 也 如 此 )。 因 此 ， 在 第 +2 轮 中 ， 在 此 之 前 各 轮 中 没有 判定 的 所 有 正确 进程 接 到 N-i 条 v- 证 
据 ， 并 对 v 判 定 。 口 

引 理 14.22 limPr[ 在 < 的 轮 中 ， 未 进行 判定 ] = 0。 

证 明 。 设 5 是 N-! 个 正确 进程 的 集合 (存在 这 样 的 集合 )， 假 设 直到 第 上 轮 ， 会 发 生 判 定 。 


A 
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公平 调度 假设 殖 含 ， 对 于 某 些 p > 0, Effet, SHENAE ShN- EE 
投票 的 概率 至 少 为 p。 这 种 情况 至 少 以 概率 外 = 户 发 生 在 三 个 后 续 轮 中 ， 如 ，ko+1 和 人 +2。 


var value, : (0, 1) (* p’s vote *) 
round p : integer (* Round number *) 
weight : integer (* Weight of p’s vote *) 
msgs,|0..1]  : integer (* Count received votes *) 
witness,|0..1] : integer (* Count received witnesses *) 


begin 
while yp = b do 
begin witnessp[0], witness,(1], msgs,[0], msgs,[1] := 
0,0,0,0; (* Reset counts *) 
shout ( vote, round,, value, weight, ); 
while msgs,[0] + msgs,[1] < N — t do 
begin receive (vote, r, v, w) ; 
if r > round, then (* Future round ... *) 
send (vote,r,v,w) top (*... process later *) 
else if r = round, then 
begin msgs,[v] := msgs,[v] +1 ; 
if w > N/2 then  (* Witness *) 


witnessp[v] := witnessp[v] + 1 


end 
else (* r < round,, ignore *) skip 
end ; 
(* Choose new value: vote and weight in next round *) 
if witnessp[0] > 0 then value, := 0 
else if witness,(1] > 0 then value, := 1 
else if msgs,[0] > msgs,[1] then value, := 0 
else value, := 1 ; 
weight, := msgs,|valuep| ; 
(* Decide if more than t witnesses *) 
if witnessp[valuep] > t then yp := value, ; 
round, := round, + 1 
end ; 

(* Help other processes decide *) 

shout (vote, round,, valuep, N — t) ; 

shout (vote, round, + 1, valuep, N — t) 

end 





图 14-3 HR-HR MB: 


如 果 发 生 这 种 情形 , SHERRI SS kot AOA Td SS, 因此 在 第 & 轮 中 选择 同一 个 值 vo。 
5 中 的 所 有 进程 在 第 ko+1 轮 投票 赞成 v。， 冀 含 着 5 中 的 每 个 进程 在 第 ko+1 轮 接 到 赞成 vo 的 N-1 次 
投票 。 这 意味 着 ，5 中 的 进程 在 第 k+2 轮 为 vo 作证 。 因 此 它们 在 第 ko+2 轮 都 接 到 为 vo 作证 的 N-t 
> ! 条 证 据 ， 并 在 那 一 轮 中 对 vo 进行 判定 。 由 此 可 得 ， 

Pr[S 中 的 进程 在 第 k+2 轮 还 未 进行 判定 的 概率 ] < y x Pr[S 中 的 进程 在 第 轮 之 前 还 未 进行 
判定 的 概率 ] 

引 理 得 证 。 口 

引 理 14.23 如 果 所 有 进程 初始 算法 时 输入 为 vx， 那么 在 第 2 轮 后 ， 所 有 进程 对 vy 判定。 

证 明 。 在 第 1 轮 中 ,所 有 进程 只 收 到 对 v 的 赞成 投票 ， 因 此 所 有 进程 在 第 2 轮 中 为 v 作 证 。 
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这 更 含 着 ， 它 们 在 那 一 轮 中 对 "进行 判 定 。 . 口 
定理 14.24 对 于 :< MW2， 图 14-3 所 示 的 算法 是 概率 的 、t- 损 毁 - 健 壮 的 一 致 性 协议 。 
证 明 。 引 理 14.22 证 明了 收敛 性 。 引 理 14.21 证 明了 一 致 性 。 引 理 14.23 列 含 了 非 -平凡 性 。 














在 习题 14.11 中 ， 进 一 步 分 析 了 判定 对 于 输入 值 的 相关 性 。 
14.4.2 Byzantine- 健 壮 一 致 性 协议 


Byzantine 故 障 模 型 比 损毁 模型 更 恶意 ， 因 为 Byzantine 进 程 可 能 会 执行 任意 的 状态 转移 ， 
并 且 可 能 发 送 与 算法 不 一 致 的 消息 。 我 们 用 y ~ 6 (或 y ~ s) 表示 ， 存 在 正确 步 的 序列 ， 
即 协议 的 转移 (在 5 的 进程 中 )， 引 导 系 统 从 配置 y 到 5。 类 似 地 ， 如 果 存 在 正确 步 的 序列 ， 从 
初始 配置 通 到 y， 则 称 ? 是 可 达 的 。Byzantine 模 型 的 恶意 列 含 着 ， 它 有 比 损毁 模型 更 低 的 弹性 
最 大 值 。 

定理 14.25 不 存在 1> N/3 的 1t-Byzantine- 健 壮 一 致 性 协议 。 

证 明 。 反 证 法 。 假 设 存 在 这 样 的 协议 。 对 于 这 样 协议 的 双 价 初始 配置 的 存在 性 留 给 读者 
WEAR (如 往常 一 样 ， 利 用 非 -平凡 性 )。 

协议 的 高 弹性 蕴含 着 ， 可 以 这 样 选择 进程 的 两 个 集合 S 和 T， 满 足 IS1> N-t T> N-1, H 
ISATi<t。5 和 7 足够 大 可 以 独立 存在 ， 但 是 它们 的 交集 可 能 是 完全 恶意 的 。 这 一 点 可 用 来 证 
明 不 存在 可 达 的 双 价 配置 。 

声明 14.26 可 达 配 置 7 或 者 是 5-0- 价 的 和 T-0- 价 的 ， 或 者 是 5-1- 价 的 和 T-1- 价 的 。 

证 明 。 由 于 7 可 由 正确 步 序列 达到 ， 选 择 ! 个 故障 进程 集合 的 所 有 可 能 性 仍然 悬 而 未 定 。 相 
反 ， 假设 S 和 7 可 达 不 同 判 定 ， 即 y ~* s 6 My~ 7 ôr, 其 中 6, (6r) BSH (TH) 的 所 有 进程 
已 经 对 v( 5) 进行 判定 的 配置 。 通 过 假设 在 8 站 7 中 的 进程 是 恶意 的 ， 并 组 合 调度 如 下 ， 就 可 
以 达到 不 一 致 的 状态 。 从 配置 x 开始 ，5 nT 中 的 进程 与 5 中 的 其 他 进程 协同 ， 就 如 同 在 一 个 导 
致 S 中 的 v- 判 定 的 序列 中 一 样 。 当 5 中 的 进程 进行 这 个 判定 时 ， 恶 意 进 程 将 它们 的 状态 恢复 到 
如 同 在 Y 中 的 一 样 ， 随 后 与 7 中 的 进程 协同 ， 就 如 同 在 一 个 导致 T 中 的 ?判定 的 序列 中 一 样 。 这 
导致 一 个 配置 ， 其 中 的 正确 进程 已 进行 不 同 判定 ， 与 一 致 性 要 求 矛盾 。 口 

声明 14.27 不 存在 可 达 的 双 价 配置 。 

证 明 。 设 给 定 可 达 的 双 价 配置 y。 不 妨 假设 。) 是 3-1- 价 的 和 7-1- 价 的 (声明 14.26 )。 然 而 ， 
?是 双 价 的 ， 因 此 0- 判 定 的 配置 也 是 由 y 可 达 的 (显然 是 以 S 和 7 之 间 的 协同 )， 在 从 y 到 6 的 配 
置 序 列 中 ， 存 在 两 个 后 续 配 置 % 和 y。， 其 中 ,是 $-v- 价 的 和 T-v- 价 的 。 设 p 是 引起 从 到 转移 的 
进程 。 现 在 ，pP E 5 是 不 可 能 的 ， 因 为 y 是 5-1- 价 的 ，% 是 $-0- 价 的 。 类 似 地 ，p © 7 是 不 可 能 的 。 
这 是 矛盾 。 口 

最 后 声明 与 双 价 初始 配置 的 存在 性 矛盾 。 因 此 定理 14.25 得 证 。 口 

Bracha 和 Toueg 的 Byzantine- 健 壮 一 致 算法 ”对 于 + < N/3， 存 在 t-Byzantine- 健 壮 的 一 至 
性 协议 。 通 信 系统 允许 进程 决定 所 接收 的 消息 由 哪个 进程 来 发 送 是 十 分 必要 的 。 如 果 
Byzantine 进 程 p 可 以 向 正确 进程 发送 消息 ， 并 成 功 地 伪装 成 如 像 r 接 收 这 条 来 自 g 的 消息 ( 参 
见 图 14-4)， 那 么 问题 就 变 得 不 可 解 。 确 实 ， 进 程 p 能 够 模拟 足够 多 的 正确 进程 ， 来 实施 在 进 
程 r 中 的 不 正确 判定 。 

如 同 损毁 -健壮 协议 ，Byzantine- 健 壮 协 议 (图 14-5 所 示 的 算法 ) 按照 轮 执行 。 在 每 一 轮 中 ， 
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每 个 进程 都 能 提交 投票 ， 当 有 是 够 多 的 进程 投票 同一 个 值 时 ， 就 进行 判定 。 低 弹性 (1 < N3) 消 
除了 区 别 证 据 和 非 证 据 的 必要 性 ， 一 旦 接 到 多 于 (N+1) /2 个 对 同一 个 值 的 投票 ， 就 进行 判定 。 





图 14-4 模拟 其 他 进程 的 Byzantine 进 程 


故障 模型 的 恶意 性 使 得 引入 投票 验证 机 制 的 成 为 必要 。 这 是 协议 的 关键 所 在 。 没 有 这 样 
一 个 机 制 ，Byzantine 进 程 可 能 向 各 个 正确 进程 发 送 不 同 的 投票 ， 在 正确 进程 之 间 干 扰 投 票 过 
程 。 而 在 损毁 模型 中 ， 这 样 的 恶意 行为 是 不 可 能 的 。 验 证 机 制 保证 ， 尽 管 Byzantine 进 程 r 可 以 
向 正确 进程 p 和 4 发 送 不 同 的 投票 ， 它 不 能 愚弄 进程 p 和 4g， 使 它们 接受 对 r 的 不 同 投票 (在 某 些 
轮 中 )。 

验证 机 制 基 于 对 消息 的 响应 。 进 程 向 所 有 近邻 发 送 它 的 投票 (如 initial，i)， 在 某 些 轮 
中 ， 每 个 进程 一 旦 接收 到 对 某 些 进程 的 第 一 次 投票 ， 就 对 投票 做 出 响应 (如 echo，ec)。 如 果 
接 到 多 于 (N+1)/2 个 对 它 已 经 接收 到 的 消息 的 响应 ， 进 程 就 将 接受 投票 。 验 证 机 制 保持 正确 
进程 之 间 通 信 的 (部 分 ) 正确 性 ( 引 理 14.28 ) ， 正 确 进程 从 不 接收 对 同一 进程 的 不 同 投票 
( 引 理 14.29) ， 也 不 会 引起 死 锁 (2114.30). 

我 们 称 进程 p 在 第 k 轮 中 接受 一 个 对 进程 /的 v- 投 票 ， 如 果 p 一 旦 接 到 投票 消息 <vote，ec，r， 
v，k>， 使 得 msgsp[v] 增 加 。 算 法 保证 仅 当 接 到 N-t 个 投票 后 ，p 经 过 第 x 轮 ， 同 时 保证 p 在 每 一 
轮 中 至 多 接收 对 每 个 进程 的 一 次 投票 。 

引 理 14.28 如果 正确 进程 p 在 第 k 轮 接受 对 于 正确 进程 的 投票 vy， 那么 /已 经 在 第 k 轮 中 对 v 
投票 。 

证 明 。 进 程 p 一 旦 从 超过 (N + 1) /2 个 不 同 进程 接收 消息 <vote，eec，+，y，k>， 就 接收 投 
票 ， 至 少 有 一 个 正确 进程 已 经 向 p 发 送 这 样 的 消息 。 进 程 : 一 旦 接收 到 来 自 / 的 消息 <vote，in， 
r，Vv，k>， 就 向 p 发 送 响 应 ， 由 于 r 是 正确 的 ， 这 蕴含 着 /在 第 k 轮 中 向 v 投 票 。 oO 

引 理 14.29 ”如 果 正 确 进程 p 和 进程 qg 在 第 k 轮 接受 对 于 进程 7 的 一 张 投票 ， 那 么 它们 接收 的 
是 同一 投票 。 

证 明 。 假 设 在 第 t 轮 中 ， 进 程 p 接 收 对 于 r 的 v- 投 票 ， 进 程 9 接收 一 次 w- 投 票 。 因 此 ， 进 程 p 
已 接收 超过 (N +t) /2 个 进程 的 消息 <vote，ec ，r，v，k>， 进 程 q 已 从 超过 (N+ 1)/2 个 进程 接 
收 消息 <vote，ec，r，w，k>。 因 为 只 有 N 个 进程 ， 超 过 1 个 的 进程 已 经 向 p 发 送 消息 <vote， ec, 
~，vY， 人 并 向 9 发 送 消息 <vote，ee，r，w， 人 >。 这 蕴含 着 至 少 有 一 个 正确 进程 这 样 做 ， 因 此 ， 
= Wo g 

3114.30 ”如 果 所 有 正确 进程 都 开始 第 k 轮 ， 那 么 所 有 正确 进程 在 那 一 轮 中 接受 足够 多 
的 授时 来 完成 那 一 轮 。 

证 明 。 开 始 value, = v 的 第 x 轮 的 正确 进程 "， 在 那 一 轮 中 向 所 有 近邻 发 送 初始 投票 ， 所 有 
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正确 进程 都 对 此 发 出 响应 。 因 此 ， 对 于 正确 进程 P 和 ~， 至 少 有 N-;! 个 进程 向 p 发 送 消 息 <yote， 
ec, r, v, 大 >， 并 允许 p 在 第 k 轮 中 接受 对 /的 v- 投 票 ， 除 非 N-! 个 其 他 投票 之 前 已 被 接受 。 由 
此 可 得 ， 进 程 p 在 这 一 轮 中 ， 接 受 N-! 个 投票 。 














var valuep : (0,1) init z, ; 
round, : integer init 0 ; 
msgs.,,|0..1] : integer init 0 ; 


echos,[P, 0..1] : integer init 0 ; 


while true do 
begin forall v, g do begin msgs,|v] := 0 ; echosplg, v] := 0 end ; 
shout ( vote, in, p, value,, round, ) ; 
(* Now accept N — t votes for the current round *) 
while msgs,[0] + msgs,[1] < N —t do 
begin receive (vote, t,r,v,rn) from q ; 
if ( vote, t,r,*,rn) has been received from q already 
then skip (* q repeats, must be Byzantine *) 
else if t = in and q#r 
then skip (* q lies, must be Byzantine *) 
else if rn > round, 
then (* Process message in later round *) 
send (vote, t, r, v, rn) to p 
else (* Process or echo vote message *) 
case t of 
in : shout (vote, ec, r, v, rn) 
ec : if rn = round, then 
begin echos,[r, v] := echos,[r, v] +1 ; 
if echos,(r, v] = |(N + t)/2| +1 
then msgsplv] := msgs, (u] + 





end 
else skip (* Old message *) 
esac 
end ; 
(* Choose value for next round *) 
if msgs,[0] > msgs,[1] then value, := 0 else valuey := 1 ; 
if msgs,|value,] > (N + t)/2 then yp := valuey ; 
round, := round, + 1 
end 





图 14-5 Byzantine- 健 壮 一 致 算法 


由 此 可 得 协议 的 正确 性 证 明 ， 证 明 过 程 类 似 于 损毁 -健壮 协议 的 正确 性 证 明 。 

引 理 14.31 如 果 一 个 正确 进程 在 第 k 轮 对 v 判 定 ， 那么 所 有 正确 进程 在 第 k 轮 和 以 后 的 所 有 
轮 中 选择 v。 

证 明 。 设 5 是 至 少 (N+ 17)/2 个 进程 组 成 的 集合 ，p 在 第 x 轮 中 接受 对 它 的 v- 投 要 。 正 确 进程 
4 在 第 k 轮 中 ， 接 受 N-t 次 投票 ， 其 中 包含 至 少 ISi-t >( N-1) /2 次 对 于 $ 中 的 进程 的 投票 。 由 引 理 
14.29，g 接 受 超 过 (N-1) /2 次 的 v- 投 票 ， 这 草 含 着 g 在 第 Kk 轮 中 选择 v。 

为 了 证 明 所 有 正确 进程 在 以 后 的 轮 中 都 选择 ,假设 所 有 正确 进程 在 某 些 轮 ! 中 选择 v。 因 
此 ， 所 有 正确 进程 在 第 ! +1 轮 中 对 v 投 票 。 在 第 ! +1 轮 中 ， 每 个 正确 进程 接受 N-t 次 投票 ， 包 含 
对 于 正确 进程 的 《N-1)/2 次 投票 。 由 引 理 14.28， 正 确 进程 接受 至 少 (N-1) /2 次 vy- 投票 ， 因 此 
在 第 ! +1 轮 中 再 次 选择 v。 
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5114.32 ”limPr[ 正 确 进程 p 在 第 k 轮 之 前 还 未 进行 判定 的 概率 ] = 

证 明 。 设 5 是 至 少 N-i 个 正确 进程 组 成 的 集合 ， 假 设 进 程 p 在 第 k 轮 之 前 还 未 进行 判定 。 以 
概率 风 > 0，5 中 的 进程 在 第 x 轮 接受 对 于 N-! 个 进程 组 成 的 同一 集合 的 投票 ， 并 且 在 第 k +1 轮 ， 
只 接受 对 5 中 的 进程 的 投票 。 如 果 发 生 这 种 情况 ，5 中 的 进程 在 第 k +1 轮 平等 地 投票 ， 并 在 第 
k+1 轮 进行 判定 。 由 此 可 得 

Pr[ 在 第 k +2 轮 之 前 正确 进程 还 未 进行 判定 的 概率 ] < y x Pr[ 正 确 进 程 在 第 k 轮 之 前 还 未 进 
行 判定 的 概率 ] 

引 理 得 证 。 g 

5114.33 如 果 所 有 正确 进程 以 输入 "开始 算法 ， 那 么 最 终 要 进行 对 y 的 判定 。 

证 明 。 如 同 引 理 14.31 的 证 明 ， 可 以 证 明 ， 所 有 正确 进程 在 每 一 轮 中 会 再 次 选择 v。 

引 理 14.34 对 于 :< N/3， 图 14-5 所 示 的 算法 是 概率 的 、1-Byzantine- 健 壮 一 致 性 协议 。 

证 明 。5| 理 14.32 证 明了 收敛 性 。 引 理 14.31 证 明了 一 致 性 。 引 理 14.33 草 含 了 非 - 平 凡 性 。 口 

在 习题 14.12 中 ， 进 一 步 分 析 了 判定 对 于 输入 值 的 相关 性 。 算 法 14-5 被 描述 为 无 限 循环 以 
便于 陈述 。 我 们 最 终 描 述 如 何 修改 算法 使 得 在 每 个 判定 进程 中 能 够 终止 。 在 第 k 轮 对 v 判 定之 
后 ， 进 程 p 退 出 循环 ， 并 向 所 有 近邻 发 送 “ 多 张 ”投票 <vote，in，p，K 刀 ，v>， 以 及 响应 消息 
<vote，ec，*,，k*+，v>。 这 些 消息 被 解释 成 对 于 以 后 的 所 有 罗 的 初始 和 响应 投票 。 的 确 ， 进 
程 p 在 以 后 所 有 轮 中 对 v 投 票 ， 所 有 正确 进程 也 将 会 这 样 做 (由 引 理 14.31 可 得 )。 因 此 ， 多 消息 
就 是 算法 继续 执行 时 ， 进 程 p 要 发 送 的 那些 消息 。 只 有 一 种 可 能 的 例外 ， 就 是 对 于 恶意 初始 投 
票 的 响应 。 


14.5 弱 终 止 性 


在 本 节 ， 研 究 了 异步 Byzantine 广 播 问 题 。 广 播 的 目标 是 ， 产 生 一 个 出 现在 进程 8 中 的 值 ， 
称 为 将 军 〈general) ， 对 于 所 有 进程 ， 该 值 是 可 知 的 。 形 式 地 ， 如 果 将 军 是 正确 的 ， 则 把 判定 
值 作为 将 军 的 输入 ， 使 得 一 致 协议 的 非 平凡 性 要 求 被 加 强 。 

相关 性 如 果 将 军 是 正确 的 ， 所 有 正确 进程 对 它 的 输入 进行 判定 。 

根据 这 种 规定 ， 将 军 变 成 了 一 个 独立 的 故障 点 ， 这 殖 含 着 这 个 问题 是 不 可 解 的 。 如 以 下 
定理 所 述 。 

定理 14.35 ”不 存在 满足 收效 性 、 一 致 性 和 相关 性 的 1-Byzantine 健 壮 算法 ， 即 使 仅 当 将 军 
已 经 发 送 至 少 一 条 消息 ， 对 收效 性 有 要 求 时 。 

证 明 。 我 们 考虑 两 种 情形 。 第 一 种 情形 中 ， 假 设 将 军 是 Byzantine 的 。 这 种 情形 定义 了 可 
达 的 配置 y。 因 此 ， 在 第 二 种 情形 ， 产 生 矛 盾 。 

(1) 假设 将 军 是 Byzantine 的 ， 并 向 进程 po 发 送 初始 化 “0” 的 广播 的 消息 ， 向 进程 pr 发 送 
初始 化 “1” 的 广播 的 消息 。 然 后 ， 将 军 停止 。 我 们 称 得 到 的 配置 为 y。 

根据 收敛 性 ， 即 使 将 军 损 贷 ， 也 可 达 判 定 的 配置 。 设 8 = Pg}, 并 假设 y ~> sõn Hd 
是 0- 判 定 的 。 

(2) 对 于 第 二 种 情形 ， 假 设 将 军 是 正确 的 ， 且 输入 为 1， 并 向 进程 po 和 进程 P 发 送 初始 化 

1 ”的 广播 的 消息 ， 在 此 之 后 ， 它 的 消息 被 延迟 很 长 一 段 时 间 。 现在 假设 po 是 Byzantine 的 ， 在 

BAMEDE, 根据 y 中 的 状态 ， 改 变 其 状态 ， 外 假装 已 经 接 到 来 自 将 军 的 0- 消息 。 由 于 y ~ 
$6， 不 用 与 将 军 交互 ， 就 可 以 达到 0- 判 定 ， 这 是 不 允许 的 ， 因 为 将 军 是 正确 的 ， 且 输入 为 1。 
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不 可 能 性 是 由 这 样 一 种 情况 所 导致 的 ， 即 ， 没 有 提供 足够 多 的 输入 信息 (如 在 第 二 种 情 
形 中 所 使 用 的 )， 将 军 就 初始 化 广播 ， 并 停止 (第 一 种 情形 )。 现 在 已 证 明 ， 如 果 只 在 将 军 是 
正确 的 情形 下 要 求 终止 性 ， 则 一 种 (确定 性 的 ) 解 是 可 能 的 。 

定义 14.36 上 Byzantine- 健 壮 广播 算法 是 满足 以 下 三 个 要 求 的 算法 : 

(1) BALE 所 有 正确 进程 判定 ， 或 者 没有 正确 进程 判定 。 如 果 将 军 是 正确 的 ， 所 有 
正确 进程 判定 。 ， 

(2) 一 致 性 如 果 正 确 进程 判定 ， 那 么 它们 对 同一 个 值 进行 判定 。 

(3) 相关 性 如 果 将 军 是 正确 的 ， 所 有 正确 进程 对 它 的 输入 进行 判定 。 

异步 Byzantine 广 播 算法 的 弹性 能 被 证 明 有 界 ! < W3 ,证 明 过 程 类 似 于 定理 14.25 中 的 证 明 。 
图 14-6 所 示 的 算法 给 出 了 Bracha 和 Toueg 广 播 算法 [BT85]， 其 中 使 用 了 三 种 类 型 的 投票 消息 : 
initial 消 息 (KWin), echo E (类 型 ec) 和 ready 消 息 (类 型 re)。 每 个 进程 对 每 种 类 型 和 值 ， 
以 及 接收 了 多 少 消 息 进行 计数 ， 对 于 每 个 进程 所 接收 的 最 多 一 条 消息 计数 。 

将 军 向 所 有 近邻 发 送 一 个 初始 投票 ， 初 始 化 广播 。 进 程 一 旦 接 到 来 自 将 军 的 初始 投票 ， 就 
向 所 有 近邻 发 送 包 含 同 一 个 值 的 响应 投票 。 当 接 到 多 于 (N + 1)/2 条 带 值 vy 的 响应 消息 时 ， 就 向 
所 有 近邻 发 送 一 条 就 绪 消 息 。 所 要 求 的 响应 数 要 足够 大 ， 以 保证 没有 正确 进程 发 送 不 同 值 的 
就 结 消息 ( 引 理 14.37)。 接 到 多 于 :条 同一 值 的 就 绪 消 息 (蕴含 着 至 少 有 一 个 正确 进程 已 经 发 
送 了 这 个 消息 )， 也 会 触发 向 所 有 近邻 发 送 就 绪 消 息 。 接 到 多 于 21 个 同一 值 的 就 绪 消 息 (蕴含 
着 多 于 ! 个 正确 进程 已 经 发 送 了 这 个 消息 )， 则 会 引起 对 那个 值 的 判定 。 在 图 14-6 所 示 的 算法 中 ， 
设 有 采取 任何 措施 ， 阻 止 一 个 正确 进程 发 出 两 次 就 结 消息， 但 是 该 消息 被 正确 进程 忽略 。 


var msgsp[(in, ec, re), 0..1] :integer init 0; 


For the general only: 
shout ( vote, in, rp) 


For all processes: 
while y, = b do 
begin receive (vote, t, v} from q; 
if a ( vote, t, + ) message has been received from q already 
then skip (* q repeats, ignore *) 
else if t= in and q#g 
then skip (* q mimics g, must be Byzantine *) 
else begin msgs |t, v] := msgs,[t, v] +1 ; 
case t of 
in : if msgs fin, v] = 1 
then shout (vote, ec, v) 
ec : if msgs fec, v] = [(N + t)/2] +1 
then shout (vote, re, v) 
re : if msgs,[re, v] =t+1 
then shout (vote, re, v) ; 
if msgs, |re, v) = 2t+1 
then y, :=v 





FA 14-6 Byzantine- 健 壮 广 播 算法 





463 


D 


290 PERD E @ 





5114.37 不 存在 两 个 正确 进程 发 送 不 同 值 的 就 绪 消 息 。 

证 明 。 正 确 进程 至 多 接受 一 条 初始 消息 (从 将 军 处 ) ， 因 此 为 至 多 一 个 值 发送 响 应 。 

设 p 是 发 送 值 的 就 绪 消 息 的 第 一 个 正确 进程 ，g 是 发 送 值 w 的 就 绪 消 息 的 第 一 个 正确 进程 。 
尽管 一 旦 接收 足够 多 的 就 绪 消 息 ， 就 发 送 一 条 就 绪 消 息 。 但 这 不 是 发 送 就 结 消 息 的 第 一 个 正 
确 进程 的 情形 。 之 所 以 这 样 ， 是 由 于 在 发 送 一 条 就 需 消息 之 前 ， 一 定 已 经 接收 了 t+1 条 就 绪 消 
息 。 这 蕴含 着 来 自 至 少 一 个 正确 进程 的 就 绪 消 息 已 被 接收 。 因 此 ， 进 程 p 已 经 接收 来 自 超过 
(N+ 1)/2 个 进程 的 v- 响 应 消息 ， 进 程 9 已 经 接收 来 自 超 过 (N+ !)/2 个 进程 的 w- 响 应 消息 。 

关 为 只 有 N 个 进程 ， 且 t < NMW3， 存 在 多 于 ! 个 的 进程 ， 包 含 至 少 一 个 正确 进程 r， 从 这 个 进 
程 ， 进 程 P 已 经 接收 一 条 "一 响应 消息 ， 进 程 9 已 经 接收 一 条 w- 响 应 消息 。 因 为 * 是 正确 的 ， 蕴 
Ev=w. im 

引 理 14.38 如 果 一 个 正确 进程 判定 ， 那 么 所 有 正确 进程 判定 ， 且 对 同一 个 值 判定 。 

证 明 。 必 须 接收 多 于 21 条 的 v 的 就 绪 消 息 ， 才 能 对 v 判 定 ， 其 中 包括 来 自 正确 进程 的 超过 
条 的 就 绪 消 息 。 引 理 14.37 蕴 含 可 以 进行 判定 。 

假设 正确 进程 p 对 vy 判定 ，p 已 经 接收 21 条 就 绪 消 息 ， 包 括 来 自 正确 进程 的 多 于 1 条 的 就 绪 消 
息 。 向 p 发 送 就 绪 消 息 的 正确 进程 把 这 条 消息 发 向 所 有 进程 ， 这 蕴含 ， 所 有 正确 进程 接 到 多 于 
! 条 的 就 绪 消 息 ， 这 反 过 来 蕴含 所 有 正确 进程 发 送 就 绪 消 息 ， 因 此 每 个 正确 进程 最 终 接收 N-t > 
21 条 就 绪 消 息 ， 并 进行 判定 。 口 

引 理 14.39 如 果 将 军 是 正确 的 ， 所 有 正确 进程 对 它 的 输入 进行 判定 。 

证 明 。 如 果 将 军 是 正确 的 ， 也 没有 发 送 带 有 与 输入 不 同 值 的 初始 消息 。 因 此 ， 没 有 正确 
进程 会 发 送 带 有 与 将 军 的 输入 不 同 值 的 响应 消息 ， 这 蕴含 着 ， 至 多 ! 个 进程 发 送 这 些 坏 响 应 消 
息 。 这 些 坏 响 应 消息 的 数量 ， 不 足以 使 正确 进程 发 送 不 同 于 将 军 输入 的 就 绪 消 息 。 这 蕴含 着 
没有 一 个 正确 进程 发 送 坏 响应 消息 或 者 进行 不 正确 的 判定 。 

如 果 将 军 是 正确 的 ， 它 将 带 有 它 的 输入 的 初始 投票 发 送 到 所 有 正确 进程 中 ， 而 所 有 正确 
进程 向 所 有 近邻 发 送 带 有 该 值 的 响应 。 从 而 ， 所 有 正确 进程 将 接收 至 少 N-t+ >(N + 1) /2 条 正 
确 响 应 消息 ， 并 向 所 有 近邻 发 送 带 有 正确 值 的 就 绪 消 息 。 因 此 ， 所 有 正确 进程 接收 至 少 N-t > 
2 条 正确 就 结 消 息 ， 并 正确 判定 。 g 

5114.40 对 于 1 < N/3， 图 14-6 所 示 的 算法 是 异步 、1-Byzantine- 健 壮 的 广播 算法 。 

证 明 。 由 引 理 14.39 和 14.38 可 得 弱 终 止 性 。 由 引 理 14.38 可 得 一 致 性 。 由 引 理 14.39 可 得 相 
KE. 口 


习题 








14.1 节 


14.1 对 于 定义 14.3 中 关于 一 致 性 问题 的 三 个 要 求 (终止 性 、 一 致 性 和 非 -平凡 性 )， 和 忽略 
其 中 的 任何 一 个 ， 可 得 到 非常 简单 的 解 。 给 出 三 种 简单 解 证 明 这 一 点 。 

14.2 在 引 理 14.6 的 证 明 中 ， 假设 对 N 个 进程 2* 个 位 的 每 一 种 赋值 都 会 产生 一 种 可 能 的 输 
入 配置 。 . l 

HE ANS A Ra A, RR LAR, 

(1) ABAD EP, RAGA IH ( 即 ， 存 在 输入 为 1 的 偶数 个 进程 ) 。 

(2) 存在 两 个 已 知 的 进程 和/，,，， 每 个 初始 配置 满足 =x. 
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(3) 在 每 个 初始 配置 中 ， 至 少 存 在 [(N/2)+ 1] 个 进程 具有 相同 输入 值 。 
14.2 节 

14.3 证 明 对 于 1> NM2， 不 存在 f- 初 始 死 进程 -健壮 选举 算法 。 
14.3 节 


14.4 证 明 对 于 E- 近 似 一 致 性 问题 ， 不 存在 能 容忍 ! > NM2 个 损毁 的 算法 。 
14.5 给 出 从 以 下 集合 


{(s, r): N-t<s<NHIi<r<s} 


FJARA BOR, KIL HAR EK, 
14.6 (项 目 ) 图 14-2 所 示 的 算法 是 非 平 凡 的 吗 ? 
14.7 修改 定理 14.15 的 证 明 ， 使 其 适用 于 这 样 一 种 情形 ， 即 ，Gr 由 K 个 连通 分 量 组 成 。 466 
14.8 在 这 个 练习 中 ， 我 们 考虑 信 ， 中 -选择 问题 ， 它 是 通常 选举 问题 的 一 般 化 。 问 题 要 求 
所 有 正确 进程 对 0 (“被 击败 ”) 或 1 (CREL) 进行 判定 ， 并 且 判 定 1 的 进程 数 介 于 Kk 和 | ( 包 
括 边界 ) 之 间 。 
(1) [k, -选举 问题 有 什么 用 处 ? 
(2) 对 于 [Kk， 杂 -选举 问题 ， 用 示例 证 明 不 存在 确定 、1- 损 锅 健 壮 算法 (如 果 0 < 上 < 入)。 
(3) 对 于 [K，k+21]- 选 举 问题 ， 给 出 一 个 确定 、1- 损 毁 健壮 算法 。 


14.4 节 


14.9 收 仇 性 要 求 蕴含 期 望 执行 步 数 有 界 吗 ? 

本 节 中 所 有 算法 的 期 望 执行 步 数 有 界 吗 ? 

14.10 证明， 如 果 所 有 正确 进程 开始 执行 损 奴 -健壮 一 致 性 算法 的 第 k 轮 (图 14.3 所 示 的 
算法 )， 那 么 所 有 正确 进程 也 将 完成 第 k 轮 的 执行 。 

14.11 

(1) 证 明 ， 如 果 多 于 (N+ 1)/2 个 进程 开始 执行 损 贤 -健壮 一 致 性 算法 (图 14-3 所 示 的 算 
法 )， 且 算法 输入 为 vx， 那么 在 三 轮 之 后 ， 对 v 进 行 判定 。 

(2) 证 明 ， 如 果 多 于 (N-1)/2 个 进程 开始 执行 算法 ， 且 算法 输入 为 vy， 那么 对 vb 的 判定 是 
可 能 的 。 

(3) 如 果 只 有 (N-1)/2 个 进程 开始 执行 算法 ， 且 算 法 输入 为 ,那么 可 能 对 v 进 行 判 定 
吗 ? 

(4) 算法 的 双 价 输入 配置 是 什么 ? 

14.12 

(1) 证 明 ， 如 果 多 于 (N + 1)/2 个 正确 进程 开始 执行 算法 14-5， 且 算法 输入 为 v， 那么 v 判 
定 最 终 被 执行 。 

(2) 证 明 ， 如 果 多 于 (N + 1)/2 个 正确 进程 开始 执行 算法 14-5， 且 算法 输入 为 v，1 < NS, 
那么 在 两 轮 之 后 ， 执 行 对 vy 的 判定 。 467 


14.5 节 


14.13 证 明 不 存在 !> N/3 的 异步 、1-Byzantine- 健 壮 广 播 算 法 ， 
14.14 证 明 在 图 14-6 所 示 的 算法 的 执行 中 ， 正确 进程 至 多 发 送 N(3N +1) 条 消息 。 468 





第 15 章 同步 系统 中 的 容错 


前 一 章 研究 了 完全 异步 系统 中 可 实现 的 容错 程度 。 尽 管 能 达到 合理 的 健壮 性 ， 但 在 实际 
中 ， 由 于 使 用 计时 器 和 消息 传输 时 间 有 界 ， 可 靠 系统 总 是 同步 的 。 在 这 些 系统 中 ， 可 以 达到 
更 高 的 健壮 性 ， 而 算法 更 简单 ， 在 大 多 数 情况 下 ， 算 法 保证 了 响应 时 间 具 有 上 界 。 

系统 中 的 同步 使 故障 进程 不 可 能 通过 不 发 送信 息 而 干扰 正确 进程 。 如 果 一 个 进程 在 预期 
的 时 刻 没有 接收 到 消息 ， 就 会 用 默认 值 ， 这 样 ， 发 送 者 就 会 被 怀疑 发 生 了 故障 。 因 此 ， 损 毁 
进程 立即 被 检测 出 来 ， 不 会 在 同步 系统 中 造成 任何 难题 。 本 章 我 们 集中 研究 Byzantine 故 障 。 

在 15.1 节 ， 研 究 在 同步 网 络 中 进行 广播 的 问题 。 我 们 提出 具有 最 优 弹性 的 两 个 算法 ， 以 及 
弹性 的 一 个 上 界 〈! < N/3)。 假 设 所 有 进程 知道 广播 何 时 开始 ， 算 法 是 确定 的 ， 并 可 达到 一 致 
性 。 因 为 在 异步 系统 中 一 致 性 不 是 确定 可 达 的 (定理 14.8)。 由 此 可 得 ， 在 出 现 故 障 时 (即使 
是 一 个 损毁 故障 )， 同 步 系统 的 确 展示 了 比 异 步 系 统 更 强 的 计算 能 力 。 

在 同步 系统 中 ， 因 为 损毁 以 及 不 能 发 送信 息 会 被 检测 出 来 (因此 是 “无 害 的 ” ) ， 
Byzantine 进 程 只 能 通过 发 送 错误 信息 扰乱 计算 ， 这 些 错 误 信 息 或 者 是 有 关 其 自身 状态 的 ,或 
者 是 由 于 不 正确 地 转发 信息 所 致 。 在 15.2 节 中 ， 通 过 实例 表明 ， 提 供 信息 鉴别 方法 可 以 增强 
间 步 系统 的 健壮 性 。 有 了 这 些 机 制 ， 一 个 恶意 进程 要 对 从 其 他 进程 接收 的 信息 “撒谎 ”是 不 
可 能 的 。 但 是 仍 有 可 能 发 送 与 进程 自身 状态 不 一 致 的 信息 。 同 时 表明 ， 在 实际 中 利用 密码 技 
术 ， 可 以 实现 鉴别 方法 。 . 

15.1 节 和 15.2 节 的 算法 假设 了 一 种 理想 的 同步 系统 模型 ， 在 这 种 系统 中 计算 按照 脉冲 (也 
MAK) 进行 ， 参见 第 12 章 。 同 步 系统 的 弹性 基本 上 高 于 异步 系统 的 弹性 ， 这 表明 在 异步 模 
型 中 ， 任 何 一 种 1- 损 毁 -健壮 确定 的 脉冲 模型 是 不 可 能 实现 的 。( 在 可 靠 网 络 中 可 能 实现 这 种 模 
型 ， 称 为 同步 器 )。 

然而 ， 在 异步 有 限 延 迟 网 络 (12.1.3 小 节 ) 中 实现 脉冲 模型 是 可 能 的 ， 其 中 进程 拥有 时 
钟 ， 并 且 已 知 消息 延迟 的 上 界 。 即 使 时 钟 漂移 ， 并 且 多 达 三 分 之 一 的 进程 可 能 恶意 地 产生 故 
障 ， 实 现 也 是 可 能 的 。 实 现 中 最 困难 的 部 分 是 使 进程 时 钟 可 靠 地 同步 ， 这 个 问题 将 在 15.3 节 
中 讨论 。 


15.1 同步 判定 协议 


在 本 节 ， 我 们 给 出 同步 (脉冲 ) 网 络 中 Byzantine. 健 壮 广播 算法 ， 首先 简要 回顾 一 下 

12.1.1 节 定义 的 脉冲 网 络 模型 。 在 同步 网 络 中 ， 进 程 按照 被 标号 为 1、2、3 等 的 脉冲 来 运行 。 
只 要 进程 的 局 部 算法 没有 终止 ， 每 个 进程 都 可 执行 无 限 多 次 的 脉冲 。 用 进程 的 初始 状态 描述 

WERE, ARBAk (MRR) 后 的 配置 。 在 脉冲 ;， 每 个 进程 首先 发 送 有 限 的 消息 
集 ， 该 消息 集 取决 于 它 在 -中 的 状态 。 随 后 ， 每 个 进程 在 这 个 脉冲 中 ， 接 收发 送 给 它 的 所 有 
消息 ， 并 由 以 前 的 状态 和 本 次 脉冲 中 接收 到 的 消息 集 ， 计 算 新 的 状态 。 

脉冲 模型 是 同步 计算 的 理想 模型 。 同 步 性 反映 在 

(1) 进程 中 ， 明 显 地 同时 出 现状 态 转移 ; H 
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(2) 保证 在 那个 脉冲 的 状态 转移 之 前 ， 接 收 到 一 个 脉冲 中 的 消息 。 

这 些 理想 假设 可 以 被 弱化 成 更 符合 现实 的 假设 。 即 (1) 硬件 时 钟 的 可 用 性 ，(2) 消息 传 
输 时 间 有 上 界 。 异 步 有 限 延 迟 网 络 可 以 有 效 地 实现 脉冲 模型 (参见 12.1.3 节 )。 正 如 在 第 12 章 
中 表明 的 那样 ， 状 态 转 移 的 同时 性 仅仅 是 表面 上 的 。 在 模型 的 实现 中 ， 状 态 转移 可 能 发 生 在 
不 同时 间 ， 只 要 保证 所 有 消 息 及 时 接收 。 此 外 ， 实 现 允 许 进程 执行 无 限 次 的 脉冲 。 后 一 要 求 
不 包括 第 12 章 的 实现 在 容错 中 的 应 用 ， 因 为 它们 都 遭受 死 锁 ， 其 中 的 大 多 数 其 至 会 在 丢失 一 
条 消息 的 情形 下 ， 即 发 生死 锁 。 如 前 所 述 ， 在 15.3 节 中 将 讨论 脉冲 模型 健壮 性 的 实现 。 

因为 脉冲 模型 保证 了 在 同一 个 脉冲 中 的 传输 消息 ， 进 程 能 够 确定 一 个 近邻 没有 向 它 发 送 
消息 。 这 个 特性 在 异步 系统 中 是 没有 的 ， 并 且 这 个 特性 可 用 来 解决 一 致 性 问题 ， 甘 至 可 用 来 
解决 在 同步 系统 中 可 能 会 出 现 的 可 靠 广播 的 问题 ， 正 如 我 们 很 快 就 会 看 到 。 

在 Byzantine- 广 播 问 题 中 ， 给 定 一 个 独特 的 称 为 将 年 (general) 的 进程 ， 和 取 自 集合 V 
(通常 为 {0,1}) 的 输入 x,。 不 同 于 将 军 的 进程 称 为 中 尉 (lieutenant)。 必 须 满 足以 下 三 个 要 求 。 

(1) 终止 性 每 个 正确 进程 p 对 值 y, EV 进行 判定 。 

(2) 一 致 性 所 有 正确 进程 对 同一 个 值 判定 。 

(3) 相关 性 如 果 将 军 是 正确 的 ， 所 有 正确 进程 对 x 判定 。 

此 外 ， 可 能 还 要 求 同 时 性 ， 即 所 有 正确 进程 在 同一 个 脉冲 中 判定 。 本 节 和 下 一 节 讨 论 的 
所 有 算法 满足 同时 性 。 也 可 参见 15.2.6 节 。 


15.1.1 弹性 界限 


同步 网 络 对 于 Byzantine 故 障 的 弹性 与 异步 网 络 (定理 14.25) 的 情形 一 样 ， 即 弹性 上 界 为 1 
< N/3。Pease、Shostak 和 Lamport[PSL80] 通 过 给 出 算法 在 N/3 或 更 多 Byzantine 进 程 中 的 几 种 情 
É, 首先 证 明 工 这 个 上 界 。 与 定理 14.25 证 明 中 所 用 的 情形 不 同 ， 这 里 正确 进程 接收 矛盾 信息 ， 
允许 某 些 进程 是 故障 进程 。 然 而 ， 不 可 能 决定 哪个 进程 是 不 可 靠 的 ， 并 且 不 正确 进程 能 够 进 
行 不 正确 判定 。 

定理 15.1 不 存在 :> N/3 的 1-Byzantine- 健 壮 广播 协议 。 

证 明 。 如 同 前面 的 证 明 ，N/3 或 更 高 的 弹性 ， 允 许 把 进程 划分 为 三 组 (S$，T 和 U)， 其 中 每 
一 组 都 可 能 整个 发 生 故 障 。 包 含 将 军 的 那 组 称 为 S。 考 虑 三 种 情形 ， 推 导出 矛盾 ， 如 图 15-1 所 
示 ， 故 障 组 用 双方 框 表示 。 

情形 0 中 ， 将 军 广播 值 0， 组 &/ 中 的 进程 是 故障 进程 。 情 形 1 中 ， 将 军 广播 值 1， 组 7 中 的 进 
程 是 故障 进程 。 在 情形 0 的 第 ;个 脉冲 ， 组 U 中 的 进程 只 向 组 7 中 的 进程 发 送 已 经 在 情形 1 中 发 送 
过 的 那些 消息 (按照 协议 ) ( 即 ， 作 为 对 在 情形 1 的 第 ;i-1 个 脉冲 中 所 接收 的 消息 的 响应 的 那些 
消息 )。 对 于 5 中 的 进程 ， 它 们 发 送 由 协议 所 定向 的 消息 。5 和 7 中 的 进程 在 所 有 脉冲 中 发 送 正 
确 消息 。 在 这 种 情形 下 ， 只 有 组 U 中 的 进程 发 送 不 正确 的 消息 ， 协 议 的 规范 规定 ， 所 有 正确 进 
E, 包括 组 7 都 对 0 进行 判定 。 

情形 1 可 类 似 地 定义 。 但 是 7 中 的 进程 是 故障 进程 ， 并 发 送 它们 已 在 情形 0 中 发 送 过 的 消息 。 
在 这 种 情形 下 ，U 中 的 进程 对 1 进行 判定 。 

最 后 ， 考 虑 情形 2，$ 中 的 进程 是 故障 进程 ， 表 现 如 下 。 对 于 7 中 的 进程 ， 它们 发 送 情形 0 
中 的 消息 ， 而 对 于 7 中 的 进程 ， 它 们 发 送 情形 1 中 的 消息 。 用 归纳 法 对 脉冲 数 证 明 可 得 ，7 所 
发 送 给 U (或 由 U 发 送 给 T) 的 消息 就 是 那些 在 情形 0 (或 情形 1) 中 所 发 送 的 消息 。 因 此 ， 对 
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于 7 中 的 进程 ， 情 形 2 与 情形 0 没有 分 别 。 对 于 U 中 的 进程 ， 情 形 2 与 情形 1 没有 分 别 。 由 此 可 得 ， 
.7 中 的 进程 对 0 判定 ，U 中 的 进程 对 1 判定 ， 这 是 蔬 盾 。 O 








图 15-1 定理 15.1 证 明 的 情形 


在 证 明 中 ， 即 使 Byzantine 进 程 只 接 到 0- 情 形 中 的 消息 ， 它 们 也 可 以 发 送 1- 情 形 中 的 消息 。 
即 进 程 不 仅 能 对 自己 的 状态 “ 搬 谎 ”， 也 能 对 它们 接收 到 的 消息 “ 撤 谎 ”。 利 用 鉴别 机 制 能 够 
消除 这 种 可 能 性 ， 正 如 在 15.2 节 中 将 要 讨论 的 。 这 会 导致 弹性 为 N-1 的 结果 。 


15.1.2 ”Byzantine 广播 算法 


本 小 节 中 ， 将 证 明 前 面 小 节 中 所 证 明 的 弹性 上 界 。 而 且 与 异步 网 络 的 情况 相反 ， 利 用 确 
定 算法 就 可 达到 最 大 弹性 。 我 们 给 出 Pease et al.[PSL80] 提 出 的 递归 算法 。 该 算法 能 容忍 1 个 
Byzantine 故 障 ， 其 中 fr < N/3。 弹 性 是 算法 的 参数 。 

图 15-2 所 示 的 算法 表示 广播 算法 Broadcast (N，0)。 该 算法 可 以 容忍 没有 故障 (+ = 0)， 
并 且 如 果 没 有 出 现 故 障 ， 所 有 进程 就 对 脉冲 1 中 将 军 输 入 进行 判定 。 如 果 出 现 故 障 ， 一 致 性 可 
能 受到 侵犯 但 是 终止 性 (和 同时 性 ) 仍然 会 得 到 保证 。 


The general sends (value, zy ) to all processes, 
` the lieutenants do not send. 
receive messages of pulse 1. 


The general decides on z4. 
Lieutenants decide as follows: 
if a message (value, x) was received from g in pulse 1 
then decide on z 
else decide on udef 





图 15-2 Broadcast (N, 0) 算法 
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弹性 : > 0 的 协议 (图 15-3 所 示 的 算法 ) 递归 调用 弹性 为 六 1 的 过 程 。 将 军 在 脉冲 1 中 将 它 的 
输入 发 送 给 所 有 中 尉 ， 在 下 一 个 脉冲 中 ， 每 个 中 尉 将 所 接收 的 值 广播 给 其 他 中 尉 ， 但 是 这 个 广 
播 的 弹性 为 :-1。 这 个 减 小 的 弹性 是 算法 中 的 微妙 之 处 ， 因 为 (如 果 将 军 是 正确 的 ) 在 中 尉 中 ， 
有 可 能 找 出 所 有 ! 个 Byzantine 进 程 ， 因 此 故障 的 实际 数 可 能 超过 人 符 套 调用 Broadcast 的 弹性 。 有 
必要 利用 弹性 t 和 实际 故障 进程 数 /进行 推理 来 证 明 所 得 算法 的 正确 性 (参见 引 理 15.3)。 在 脉 神 
t +1 中 ， 幅 套 调用 产生 一 次 判定 ， 因 此 中 尉 p 在 N-i 个 由 大 ,广播 中 进行 判定 。 这 N-1 个 判定 被 存 
储 在 数组 W, 中 ， 由 这 个 数组 ， 通 过 多 数 投票 (这 里 忽略 了 直接 从 将 军 处 所 接收 的 值 ! )， 得 到 
P 的 判定 。 为 此 ， 一 个 确定 性 的 函数 major 被 定义 在 数组 上 ， 该 函数 具有 这 样 的 性 质 ， 即 ， 如 果 
v 有 W 中 的 多 数 投票 ( 即 多 于 一 半 的 输入 等 于 vy)， 那 么 major (W) =v. 


The general sends ( value, z, ) to all processes, 
the lieutenants do not send. 
receive messages of pulse 1. 
Lieutenant p acts as follows. 
if a message (value, x) was received from g in pulse 1 
then z, := x else z, := udef ; 
Announce zp to the other lieutenants by acting as a general 


in Broadcast,(N ~ 1, t — 1) in the next pulse 


receive messages of pulse t + 1. 

The general decides on zy. 

For lieutenant p: 

a decision occurs in Broadcast,(N — 1, t — 1) for each lieutenant q. 
W,[q] := decision in Broadcast,(N — 1, t — 1); 
Yp := major(W,) 





图 15-3 Broadcast (N, t) (对 于 r> 0) 算法 


引 理 15.2 (终止 性 ) 如 果 Broadcast(N，1) 在 脉冲 1 中 开始 执行 ， 那 么 每 个 进程 在 脉冲 1+1 
PHZ. 

证 明 。 因 为 协议 是 递归 的 ， 利 用 对 ! 的 递归 可 证 明 它 的 性 质 。 

在 算法 Broadcast(N，0) (图 15-2 中 所 示 的 算法 )， 每 个 进程 在 脉冲 1 中 判定 。 

TEBE Broadcast(N, t) 中 ， 中 尉 在 脉冲 2 中 开始 执行 算法 的 递归 调用 ，Broadcast( N-1， 
让 1)。 当 在 脉冲 1 开始 执行 时 ， 算 法 在 脉冲 :判定 (这 是 归纳 假设 )， 因 此 当 在 脉冲 2 中 开始 时 ， 
所 有 嵌 套 调用 在 脉冲 :+1 判定 。 在 辣 一 个 脉冲 中 ， 在 Broadcast(N，t) 过 程 中 进行 判定 。 口 

为 了 证 明 相关 性 〈 也 用 归纳 法 )， 假 设 将 军 是 正确 的 ， 因 此 可 以 在 N-1 个 中 尉 中 ， 找 到 所 
有 1 个 故障 进程 。 由 于 ! < (N-1)/3 不 必 为 真 ， 不 能 利用 简单 归纳 法 。 我 们 利用 故障 的 实际 数 / 
进行 推理 。 

引 理 15.3 (MA) 如 果 将 军 是 正确 的 ， 且 有 /个 故障 进程 ， 并 且 N > for, MARRE 
确 进程 对 将 军 的 输入 判定 。 

证 明 。 在 算法 Broadcast(N，,0) 中 ， 如 果 将 军 是 正确 的 ， 所 有 正确 进程 对 将 军 的 输入 值 
进行 判定 。 

现在 假设 引 理 对 于 Broadcast( N-1，t-1) 成 立 。 因 为 将 军 是 正确 的 ， 将 军 在 脉冲 1 中 向 所 
有 中 尉 发 送 它 的 输入 ， 因 此 ， 每 个 正确 中 尉 g 选 择 x, = x,。 现 在 N > 2f + Oe (N-1) > 2f+ 
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在 下 一 个 脉冲 中 ， 每 个 中 尉 将 所 接收 的 值 广播 到 其 他 中 尉 中 。 因 此 ， 对 于 正确 中 尉 p 和 4， 
Broadcast,(N-1, t-1) 中 p 的 判定 等 于 x。， 即 x。。 但 是 严格 大 多 数 中 尉 是 正确 的 (N > 2f +t), 
进程 p 以 W, 值 结束 ， 其 中 大 多 数值 等 于 xs。 因 此 ，p 应 用 major 产 生出 期 望 值 x,。 

引 理 15.4 (一致 性 ) 所 有 正确 进程 对 同一 个 值 进行 判定 。 

证 明 。 因 为 相关 性 约 含 着 执行 中 的 一 致 性 ， 在 执行 中 ， 将 军 是 正确 的 ， 我 们 现在 集中 考 
虑 将 军 发 生 故 障 的 情形 。 但 另 一 方面 ， 至 多 有 寻 -1 个 中 尉 是 故障 的 ， 这 昔 含 着 嵌 套 调用 在 它们 
的 弹性 界限 之 内 运行 。 














t< NBR A-I (N-1)/3， 因 此 代 套 调用 满足 一 致 性 。 于 是 ， 对 于 嵌 套 调用 Broadcasn 


(N-1, 1-1) 中 的 每 个 中 慰 qg， 所 有 正确 中 尉 都 会 对 同一 个 x 的 值 进行 判定 。 因 此 ， 在 脉冲 1+1 
中 ， 每 个 正确 中 尉 都 只 计算 同一 个 向 量 W， 这 蕴含 着 ，major 的 应 用 在 每 个 正确 进程 中 给 出 同 
样 的 结果 。 口 
定理 15.5 ”对 于 ! < N/3, Broadcast(N, t) 协议 (图 15-2 和 图 15-3 所 示 的 算法 ) 是 一 个 f- 
Byzantine 一 健壮 广播 协议 。 
证 明 。 引 理 15.2 证 明了 终止 性 。 引 理 15.3 证 明了 相关 性 。 引 理 15.4 证 明了 一 致 性 。 口 
广播 协议 在 第 (+ +1) 个 脉冲 中 判定 ， 哪 一 个 是 最 优 的 ， 参 见 15.2.6 小 节 。 址 憾 的 是 ， 这 
个 协议 的 消息 复杂 度 是 指数 级 的 ， 参 见习 题 15.1。 


15.1.3 多 项 式 级 的 广播 算法 


本 节 给 出 Dolev et al.[DFF*82] 提 出 的 Byzantine 广 播 算 法 ， 它 的 消息 复杂 度 和 位 复杂 度 为 
多 项 式 级 的 。 时 间 复 杂 度 要 比 前 面 协议 的 要 高 。 算 法 要 求 2! +3 个 脉冲 来 实现 判定 。 在 下 面 的 
描述 中 ,假设 N = 31 +1， 而 N > 3!+1 的 情形 将 在 以 后 讨论 。 

算法 利用 两 个 阔 值 ，L = ! +1 和 = 2t +1。 这 些 数 的 选取 应 满足 (1) 个 进程 组 成 的 每 个 
集合 至 少 包含 一 个 正确 进程 ，(2) A 个 进程 组 成 的 每 个 集合 至 少 包含 L 个 正确 进程 ，(3) 至 少 
存在 H 个 正确 进程 。 注 意 假设 N> 31 +1 是 L 和 满足 上 述 三 个 性 质 的 充分 必要 条 件 。 

算法 交换 <bm，v> 型 的 消息 ， 其 中 v 值 或 为 1 ， 或 为 进程 名 。( bm 代表 “广播 消息 ">)。 进 程 
Pp 维 持 一 个 二 维 布 尔 表 R， 其 中 R,[q，v] 为 真 ， 当 且 仅 当 p 已 经 接收 到 来 自 进程 的 消息 <bm，v>。 
初始 时 ， 表 中 的 所 有 输入 值 为 假 ， 并 且 假 设 在 每 个 脉冲 的 接收 阶段 更 新 这 张 表 (算法 15-4 中 并 
没有 证 明 )。 观 察 可 见 ，R, 在 脉冲 中 是 单调 的 ， 即 在 某 个 脉冲 中 ， 如 果 R,[g，v] 变 为 真 ， 则 在 
以 后 的 脉冲 中 它 仍然 为 真 。 此 外 ， 由 于 正确 进程 只 向 所 有 近邻 发 送 消息 ， 在 每 个 脉冲 结束 时 ， 
对 于 正确 进程 p、g 和 r， 有 R,[r,，v] = R,[r, vl 

与 前 一 节 的 广播 协议 不 同 ，Dolev 等 人 提出 的 协议 关于 值 0 和 1 是 不 对 称 的 。 对 0 的 判定 是 默 
认 值 ， 如 果 没 有 足够 多 的 消息 被 交换 ， 就 选择 对 0 的 判定 。 如 果 将 军 的 输入 为 !1， 它 将 向 所 有 近 
邻 发 送 消息 <bm，1>， 并 且 一 旦 收 到 足够 多 的 回应 <zbm，gq> 型 的 消息 ， 就 引起 进程 对 1 判定 。 

算法 中 三 种 类 型 的 活动 是 相关 的 : 开始 执行 (initiating )、 支 持 (supporting) 和 确认 
(confirming). 

(1) 支持 。 如 果 p 在 4 发 送 消息 <bm，1> 的 较 早 脉冲 中 已 经 接收 到 足够 的 证 据 ， 那么 进程 p 
在 脉冲 i 中 支持 进程 9。 如 果 是 这 种 情况 ，p 将 在 脉 串 中 发 送 消息 <bm，g>。 如 果 p 已 经 接 到 来 
自 4 的 消息 <bm，1> ， 则 称 进程 p 是 g 的 直接 支持 者 。 如 果 p 已 经 接收 至 少 /个 进程 的 消息 <bm ， 
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4g> ， 则 称 进程 ?是 4g 的 间接 支持 者 。P 所 支持 的 进程 的 集合 3% 可 由 尺 隐 含 地 定义 为 
DS, = {4: R,Lq,1]} 
IS, = {q :#{r: Rtg} > L} 
S, = DS,UIS, 


成 为 间接 支持 者 的 闭 值 草 含 着 ， 如 果 一 个 正确 进程 支持 进程 9*， 那 么 4 已 经 至 少 发 送 了 一 条 
消息 <bm，1>。 实 际 上 ， 假 设 某 些 正确 进程 支持 94， 并 设 混 发 生 这 种 情况 的 第 一 个 脉冲 。 因 为 
支持 9 间接 地 要 求 ， 至 少 接收 到 较 早 脉冲 中 正确 进程 的 一 条 消息 <bm，9g>， 正 确 进 程 对 4 的 第 一 
次 支持 是 直接 的 。 正 确 进程 的 直接 支持 蕴含 着 ， 这 个 进程 已 经 接 到 来 自 q 的 消息 <bm，1>。 

(2) 确认 。 进 程 p 一 旦 接 到 用 个 进程 的 消息 cbm，4>， 则 确认 进程 『， 即 


C, ={q:#{r: R,[r.q]} > HY 


国 值 的 选择 蕴含 着 ， 如 果 一 个 正确 进程 p 确 认 了 4g， 那 么 所 有 正确 进程 至 多 在 一 个 脉冲 之 
后 确认 q。 假 设 p 在 脉冲 之 后 确认 gq。 进程 p 已 经 接收 到 HH 个 进程 的 消息 <zbm，g>，( HIRAM 
E) 至 少 包括 7 个 4 的 正确 支持 者 。4 的 正确 支持 者 向 所 有 进程 发 送 消 息 <bm，4>， 荀 含 着 在 第 
i 个 脉 溃 ， 所 有 正确 进程 至 少 接收 L 个 消息 <bm，q>， 并 在 第 i +1 个 脉冲 中 支持 9。 因 此 ， 在 第 i 
+I 个 脉冲 中 ， 所 有 正确 进程 发 送 消息 <zbm，g>， 由 于 正确 进程 数 至 少 为 有 ， 那 么 每 个 正确 进 
程 接收 足够 多 的 支持 来 确认 4。 

(3) 开始 执行 。 当 进程 p 有 足够 多 证 据 ， 证 明 最 终 判定 值 为 1 时， 进程 p 开 始 执行 。 执 行 开 
始 后 ， 进 程 p 发 送 消息 <bm，1>。 三 种 类 型 的 证 据 可 以 引起 初始 执行 ， 即 (1) pee, Hs, 
=1, (2) p 在 脉冲 1 中 接收 来 自 将 军 的 消息 <zbm，1> ，(3) 在 后 一 轮 脉 冲 的 最 后 ，p 已 经 确认 
足够 多 中 尉 。 尤 其 需要 关注 最 后 一 种 可 能 性 ， 因 为 “足够 的 ”确认 的 中 导数 在 执行 过 程 中 会 
增加 ,确认 的 将 军 并 不 对 此 计数 。 在 前 三 个 脉冲 中 ，L 个 中 尉 被 确认 来 开始 执行 ， 但 是 从 第 四 
个 脉冲 开始 ， 每 两 个 脉冲 闹 值 增加 一 次 。 因 此 ， 按 照 规则 (3) 的 要 求 ， 到 第 ;个 脉冲 结束 时 ， 
需要 确认 Th (i) = L + max (0，1i/2J-1) 个 中 尉 ， 才 开始 执行 。 在 算法 中 ，C4 表 示 确 认 的 中 
尉 的 集合 ， 即 Cs \{g}。 布 尔 变 量 ini, 表 示 p 的 初始 执行 。 

如 果 正确 中 尉 7 在 第 i 个 脉冲 的 最 后 开始 执行 ， 所 有 正确 进程 在 第 i +2 个 脉冲 的 最 后 确认 r+。 
实际 上 ，7 在 第 ; +1 个 脉冲 向 所 有 近邻 发 送 消息 <bm，1>， 因 此 在 第 ; +2 个 脉冲 中 ， 所 有 正确 
进程 《直接 ) 支持 +-， 在 那个 脉冲 中 ， 每 个 进程 至 少 接收 A 个 消息 <bm，g>。 

算法 继续 21+3 个 脉冲 ， 此 时 ， 如 果 进 程 p 已 经 确认 至 少 H 个 进程 (这 里 将 军 没有 计数 ), p 
对 1 进行 判定 ， 否 则 对 0 判定 。 参 见 图 15-4 所 示 的 算法 。 

将 军 成 为 能 够 强制 自己 开始 执行 (在 其 他 进程 中 ) 的 惟一 进程 ， 在 算法 中 占有 重要 地 位 。 
显而易见 ， 如 果 将 军 正确 开始 执行 ， 就 会 引起 消息 雪崩 ， 使 得 所 有 正确 进程 确认 万 个 进程 ， 并 
对 值 1 进行 判定 。 同 时 ， 如 果 它 没有 开始 执行 、 就 不 存在 消息 的 “和 危险 性 聚集 *"， 这 些 消息 能 
使 得 任何 正确 进程 进行 初始 执行 。 

引 理 15.6 图 15-4 所 示 的 算法 满足 终止 性 (同时 性 ) 以 及 相关 性 。 

证 明 。 从 算法 可 以 看 出 ， 所 有 正确 进程 在 21+3 个 脉冲 结束 时 进行 判定 ， 这 证 明了 终止 性 
和 同时 性 。 为 了 证 明 相 关 性 ， 我 们 假设 将 军 是 正确 的 。 

如 果 将 军 是 正确 的 ， 且 输入 为 1， 在 脉冲 1 中 ， 它 向 所 有 近邻 发 送 消息 <bm，1> ， 使 得 每 
个 正确 进程 9 开始 执行 。 因 此 ， 每 个 正确 进程 4 在 脉冲 2 中 向 所 有 近邻 发 送 消息 <bm，1>， 到 第 
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P 问 所 有 近邻 发 送 支 持 每 个 正确 进程 9 的 消息 <bm，1>， 因 此 ， 在 第 3 个 脉冲 结束 时 ， 每 个 正确 
进程 都 从 其 他 各 正确 进程 接收 到 消息 <bm ，9>， 并 导致 其 对 4 的 确认 。 因 此 在 第 3 轮 结束 后 ， 
每 个 正确 进程 已 经 确认 了 有 个 进程 ， 表明 最 终 的 判定 将 会 是 1。( 所 有 正确 进程 比 其 他 进程 早 一 
个 脉冲 支持 并 确认 将 军 。) 


: boolean init false ; 
: boolean init if p = g A £p = 1 then true else false ; 


Pulse i: (* Sending phase *) 
if ini, then shout (bm, 1) ; 
forall q € Sp do shout (bm, q) ; 
receive all messages of pulse i ; 
(* State update *) 
if i = 1 and R,[g, 1] then ini, := true ; 
if #CY > Th(i) then inip := true ; 
if i = 2t +3 then (* Decide *) 
if #C, > H then y, := 1 else yp := 0 





图 15-4 可 靠 -广播 协议 算法 


如 果 将 军 是 正确 的 ， 且 输入 为 0， 在 脉冲 1 中 ， 它 并 不 向 所 有 近邻 发 送 消 息 <zbm，1>， 其 
他 正确 进程 也 不 向 所 有 近邻 发 送 消息 。 假 设 在 脉冲 1 到 i-1 中 ， 没 有 正确 进程 已 经 开始 执行 ， 
那么 在 脉冲 i 中 没有 正确 进程 发 送 消息 <bm，1>。 在 第 i 个 脉冲 结束 后 ， 没 有 正确 进程 支持 或 者 
确认 任何 正确 进程 ， 因 为 正如 前 面 所 看 到 的 ， 这 蕴含 着 以 后 的 进程 已 经 发 送 了 消息 <bm，1>。 
因此 ,在 第 个 脉冲 结束 时 ， 没 有 正确 进程 开始 执行 。 由 此 可 得 ， 根 本 没有 正确 进程 开始 执行 。 
这 理 含 着 没有 正确 进程 曾经 确认 一 个 正确 进程 ， 因 此 没有 正确 进程 确认 多 于 个 进程 ， 且 在 最 
终 脉冲 对 0 进行 判定 。 口 

我 们 继续 证 明 一 臻 性， 并 且 在 下 面 的 引 理 中 ,假设 将 军 是 有 故障 的 。 当 至 少 有 四 个 脉冲 
要 进行 时 ， 足 够 多 会 不 可 避免 地 导致 1- 判定 的 消息 的 “危险 性 聚集 * ， 由 Z 个 正确 进程 的 开始 
执行 来 创立 。 

引 理 15.7 如果 到 第 i 个 脉冲 结束 时 ， 有 L 个 正确 进程 开始 执行 ， 其 中 i < 2:， 那 么 所 有 正 
确 进程 对 值 1 判定 。 

证 明 。 设 混在 该 脉冲 后 至 少 ! 个 正确 进程 开始 执行 的 第 一 个 脉冲 ， 设 4 表示 第 ;个 脉冲 结束 
时 已 经 开始 执行 的 正确 进程 的 集合 。4 中 所 有 正确 进程 都 是 中 尉 ， 因 为 将 军 是 有 故障 的 。 在 第 
i +2 个 脉冲 结束 时 ， 所 有 正确 进程 已 经 对 A 中 的 中 尉 进行 确认 。 证 明 在 那个 时 刻 ， 所 有 正确 进 
程 开 始 执 行 。 

如 果 i = 1: 到 第 3 个 脉冲 结束 时 ， 所 有 正确 进程 已 经 确认 了 A 中 的 中 尉 ， 并 且 开 始 执行 ， 
因为 #4 >L = Th (3). 

如 果 i > 2: 至 少 4 中 的 一 个 进程 ， 如 ，r 在 脉冲 开始 执行 ， 因 为 它 已 经 确认 了 Th(i) 个 中 
尉 〈 在 第 1 个 脉冲 中 ， 只 可 能 通过 接收 将 军 的 消息 <bm，1> 才 能 开始 执行 )。 在 第 ; +1 个 脉冲 结 


束 时 ， 所 有 正确 进程 确认 了 Th(i) 个 中 慰 ， 但 是 r 并 不 属于 这 Th(i) 个 确认 的 中 尉 ， 因 为 在 第 i 


+1 个 脉冲 r 第 一 次 发 送 消息 <bm，1>。 然 而 ， 所 有 正确 进程 在 第 ; +2 个 脉冲 结束 时 ， 都 将 已 经 
确认 r。 因 此 ， 在 第 i +2 轮 结束 时 ， 它 们 至 少 已 经 确认 了 了 (站 ) +14 RH. BI, ETA (i 
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+2) =Th(i) +1， 所 有 正确 进程 开始 执行 。 

现在 ， 由 于 到 第 i +2 个 脉冲 结束 时 ， 所 有 正确 进程 开始 执行 ， 它 们 在 第 : +4 个 脉冲 结束 时 
(被 所 有 正确 进程 ) 确认 ， 因 此 所 有 正确 进程 至 少 已 经 确认 了 5 个 中 挝 。 由 于 假设 i < 22, 14+ 4 
< 2f+3， 因 此 ， 所 有 正确 进程 对 值 1 进行 判定 。 口 

对 于 任何 对 1 进行 判定 的 正确 进程 ， 由 LL 个 正确 进程 所 进行 的 初始 执行 组 成 的 一 次 雪崩 是 
必须 的 。 一 个 1- 判 定 至 少 要 求 确认 H 个 进程 ， 包 括 L 个 正确 进程 ， 且 这 些 正确 进程 已 经 开始 执 
行 。 问 题 是 是 否 一 个 Byzantine 的 共 谨 能 够 使 雪崩 的 发 生 被 推迟 足够 长 时 间 ， 从 而 在 某 些 正确 
进程 中 引发 1- 判 定 ， 而 不 用 按照 引 理 15.7， 在 所 有 进程 中 执行 1- 判 定 。 当 然 ， 回 答 是 否定 的 ， 
因为 一 个 共 谋 推迟 雪崩 的 时 间 是 有 限 的 ， 我 们 精确 地 选择 脉冲 数 2! +3 来 阻止 这 种 情形 发 生 。 
原因 是 所 要 求 的 确认 的 进程 数 的 闪 值 在 增加 。 在 以 后 的 脉 钟 中 ， 它 变 得 如 此 之 高 ， 以 至 于 要 
使 下 一 个 正确 进程 开始 执行 ，Z 个 已 经 开始 执行 的 正确 中 尉 是 必须 。 

引 理 15.8 ”假设 在 算法 执行 过 程 中 至 少 有 上 个 正确 进程 开始 执行 ， 并 且 设 ;是 第 一 个 脉冲 ， 
在 这 个 脉冲 结束 时 ，L 个 正确 进程 开始 执行 。 那 么 1 < 21。 

证 明 。 一 个 正确 进程 要 在 2 或 更 高 的 脉冲 开始 ， 至 少 需 要 确认 THA(21) = L + (t-1) 个 中 
尉 。 由 于 将 军 是 有 故障 的 ， 至 多 有 革 -1 个 故障 中 尉 ， 因 此 至 少 有 ZL 个 正确 中 尉 必须 已 被 确认 ， 
这 表明 在 前 面 的 脉冲 中 ，L 个 正确 进程 必定 已 开始 执行 。 口 

定理 15.9 Dolev 等 人 提出 的 广播 算法 (图 15-4 所 示 的 算法 ) 是 一 个 上 -Byzantine- 健 壮 广播 
协议 。 

证 明 。 引 理 15.6 证 明了 终止 性 〈 以 及 同时 性 ) 和 相关 性 。 为 了 证 明 一 致 性 ， 假 设 存在 正确 
进程 对 值 1 进行 判定 。 这 蕴含 着 至 少 有 LL 个 正确 进程 已 经 开始 执行 。 由 引 理 15.8 可 得 ， 这 种 情 
形 在 脉冲 i < 21 中 第 一 次 发 生 。 而 另 一 方面 ， 由 引 理 15.7， 所 有 正确 进程 对 值 1 进行 判定 。 O 

为 了 便于 算法 的 表达 ， 一 直 假 设 ， 进 程 在 每 一 轮 中 重复 它们 在 前 几 轮 中 已 经 发 送 的 消息 。 
由 于 正确 进程 记录 了 在 前 几 轮 中 接收 的 消息 ， 因 此 这 个 假设 是 不 必要 的 ， 每 条 消息 只 发 一 次 
就 够 了 。 按 照 这 种 方式 ， 每 个 正确 进程 向 其 他 各 进程 ， 发 送 N +1 条 可 能 消息 中 的 每 一 条 至 多 
一 次 ， 这 使 得 消息 的 复杂 度 为 B(N3 )。 由 于 只 有 N +1 条 不 同 的 消息 ， 每 条 消息 只 需 包含 O 
(log N) 位 。 

如 果 进 程 数 超过 3! +1， 就 选择 31 个 活动 中 尉 执行 算法 。( 选择 是 静态 进行 的 ， 例 如 ， 按 照 
进程 名 的 顺序 ， 取 名 字 位 于 8 之 后 的 3! 个 进程 。) 由 将 军 和 活动 中 尉 通知 被 动 中 尉 它们 的 判定 ， 
并 且 被 动 中 尉 对 于 从 超过 ! 个 进程 所 接收 的 一 个 值 进行 判定 。 这 种 分 层 方法 的 消息 复杂 度 为 8 
(P+t- N)， 而 位 复杂 度 为 9B(Blogr+ty)。 


15.2 鉴别 协议 


到 自前 为 止 所 考虑 的 恶意 行为 ， 除 了 发 送 关 于 进程 自身 状态 的 不 正确 信息 ， 还 包括 不 正 
确 的 信息 转发 。 幸 运 的 是 ， 利 用 密码 手段 ， 可 以 限制 Byzantine 进 程 的 这 种 极端 恶意 的 行为 ， 
这 会 致使 定理 15.1 失 效 。 在 证 明 中 所 用 的 情形 ， 即 当 故 障 进程 只 收 到 情形 0 的 消息 时 ， 会 像 在 
情形 1 中 那样 发 送 消息 。 

本 市 中 ， 假 设 使 用 数字 签名 和 鉴别 (signing and authenticating) 消息 方法 。 发 送 消 息 M 的 
进程 Pp， 在 消息 中 增加 一 些 额外 信息 5, (MM)， 称 之 为 p 对 消息 M 的 数字 签名 (digital signature). 
不 像 手 写 的 签名 ,数字 签 名 取决 于 M， 它 把 拷贝 签名 变 成 其 他 无 用 消息 。 签 名 模式 满足 以 下 
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性 质 。 

(1) 如 果 p 是 正确 的 ， 只 有 p 才 能 可 行 性 地 计算 5, (M)， 称 这 个 计算 为 对 消息 M 的 签名 。 

(2) 每 个 进程 都 能 有 效 地 验证 (给 定 p、M 和 S$)， 是 否 $ = 9% (M)。 称 这 个 验证 为 对 消息 M 
的 鉴别 。 ' 
签名 模式 是 基于 私 钥 和 公 和 钥 (private and public key) 系统 。 第 一 条 假设 并 没有 排除 
Byzantine 进 程 通过 相互 暴露 密 钥 进行 共 谋 ， 允 许 Byzantine 进 程 伪 造 另 一 个 进程 的 签名 。 假 设 
只 有 正确 进程 才 对 它们 的 私 钥 保密 。 

我 们 将 在 15.2.2 小 节 到 15.2.5 小 节 研 究 签 名 模式 的 实现 。 在 下 一 小 节 中 ， 进 程 p 对 消息 
<msg> 的 签名 用 序 偶 <msg> : p 表 示 ， 由 消息 <msg> 和 5, (<msg>) 组 成 。 


15.2.1 高 度 弹 性 的 协议 


Dolev and Strong[DS83] 提 出 一 种 利用 多 项 式 的 消息 复杂 度 和 t +1 个 脉冲 的 有 效 Byzantine 
广播 算法 。 协 议 中 所 用 的 鉴别 机 制 允 许 无 限 弹性 。 尽 管 不 会 有 超过 N 个 进程 发 生 故 障 ， 且 如 果 
有 AN 个 进程 发 生 故 障 ， 满 足 所 有 要 求 的 集合 为 空 ， 因 此 ， 设 : < N。 它 们 的 协议 是 基于 由 
Lamport、Shostak 和 PeasefLSP82] 提 出 的 更 早 的 一 个 协议 ， 具 有 指数 级 的 消息 复杂 度 。 我 们 首 
先 给 出 后 一 种 协议 。 

在 脉冲 1 中 ,将军 向 所 有 近邻 发 送 消息 <value，xs> : 8， 包 含 它 的 〈 签 过 名 的 ) 输入 。 

在 脉冲 2 至 脉冲 ! +1 中， 进程 签名 并 转发 它们 在 前 一 次 脉冲 中 接收 到 的 消息 。 因 此 ， 在 第 i 
个 脉冲 中 所 交换 的 消息 包含 个 签名 。 对 于 接收 进程 p， 称 消息 <value v>: g ps : … :pj 为 有 
效 的 ， 如 果 满 足以 下 所 有 条 件 。 

(1) 所 有 i 个 签名 是 正确 的 。 

(2) 所 有 这 i 个 签名 来 自 个 不 同 进程 。 

(3) p 并 不 出 现在 签名 列表 中 。 

在 算法 执行 中 ， 进 程 p 维 持 值 的 集合 W,， 这 些 值 包含 在 p 所 接收 的 有 效 消息 中 。 初始 时 ， 
这 个 集合 为 空 ， 然 后 将 每 个 有 效 消 息 的 值 插入 其 中 。 

在 第 ;个 脉冲 中 所 转发 的 消息 ， 就 是 前 一 个 脉冲 中 接收 到 的 有 效 消 息 。 在 第 + +1 个 脉冲 结束 
上 时， 进程 p 共 于 W, 进 行 判定 。 如 果 W, 是 孤 集 {v}， 则 p 对 v 判 定 ; 否则 p 对 默认 值 (如 ，0) 判定 。 
为 了 保存 消息 数 ，p 只 向 那些 未 出 现在 列表 g ，p;，.…， P' 中 的 进程 转发 消息 <value; v>: g: 
Po :pi: pe 这 个 修改 对 算法 的 行为 没有 影响 ， 因 为 对 于 列表 上 的 进程 ， 消 息 不 是 有 效 的 。 

定理 15.10 对 于 t <N，Lamport、 Shostak 和 Pease 提 出 的 算法 是 正确 的 Byzantine 广 播 算 法 ， 
1t<n 利 用 t +1 个 脉冲 。 

证 明 。 所 有 进程 在 第 :+1 个 脉冲 判定 ， 蕴 含 着 算法 的 终止 性 和 同时 性 。 

如 果 将 军 是 正确 的 ， 且 输入 为 v， 所 有 进程 在 脉冲 1 接收 它 的 消息 <value， x>: 8， 于 是 所 
有 正确 进程 在 W 中 包含 "，W 中 没有 插入 其 他 值 ， 因为 将 军 没 有 签 过 其 他 值 。 因 此 ， 在 第 t +1 
个 脉 串 ， 所 有 进程 都 有 W = {v}， 并 对 v 判 定 。 这 蕴含 着 相关 性 。 

为 了 证 明 一 致 性 ， 对 于 正确 进程 p 和 4， 在 第 : +1 个 脉冲 结束 时 ， 我 们 要 证 明 W, = Ws。 假 
RER: +1 个 脉冲 结束 时 ，vEW,， 设 i 是 进程 p 一 旦 接收 消息 <value, vy> : 8: Pri o Dir B 
将 "插入 网 的 那个 脉冲 。 


情形 1: 如 果 4 出 现在 8， 户 ，...，p; 中 ， 那 么 g 自 己 已 经 看 见 v， FPS CAR A BIW, 
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情形 2: 如 果 gq 没 有 出 现在 序列 g，p，,，.….，p; 中 ， 且 i< 1:， 那 么 p 在 第 i +1 个 脉冲 中 向 g 转 发 
消息 <value，v> : g: pi … pi Pp， 因 此 4 最 壕 在 第 i+1 个 脉冲 中 使 有效 。 

情形 3: 如 果 gq 没 有 出 现在 列表 # ，p:，.…，p; 中 ， 且 i = 1 +1， 观 察 可 见 ，P 所 接收 的 消息 被 
t +1 个 连续 进程 签名 ， 至 少 包括 一 个 正确 进程 。 这 个 正确 进程 向 所 有 其 他 进程 转发 消息 ， 包 括 
4， 因 此 4 能 看 见 v。 

到 第 + +1 个 脉冲 结束 ， 由 于 W, = W,，p 和 9 判定 相同 。 口 

不 可 能 在 比 脉冲 : +1 更 早 的 脉冲 中 终止 算法 。 在 直到 ! 的 所 有 脉冲 中 ， 一 个 正确 进程 会 接 
收 仅仅 由 故障 处 理 器 创建 和 转发 的 消息 ， 并 不 发 送 给 其 他 正确 进程 ， 这 样 可 能 导致 不 一 致 的 
判定 。 

前 一 个 算法 的 中 间 结 果 ， 即 所 有 正确 进程 中 值 集 的 一 致 性 强 于 在 一 个 值 上 所 必须 达到 的 
一 致 性 。Dolev and Strong[DS83] 观 察 到 这 一 点 ， 并 提出 一 个 更 有 效 的 修改 。 事 实 上 ， 在 第 
t +1 个 脉冲 结束 时 ， 或 者 (a) 对 于 每 个 正确 进程 p， 集 合 W, 是 同一 孤 集 ， 或 者 〈b) 对 于 不 正 
确 的 进程 P， 集 合 几 是 弧 集 。 在 第 一 种 情形 中 ， 所 有 进程 对 "判定 ， 在 后 一 种 情形 中 ， 所 有 进 
程 对 0 判定 。( 或 者 如 果 想 要 这 样 修改 算法 ， 则 对 “将 军 故 障 ”进行 判定 )。 

Dolev 和 Strong 的 算法 达到 了 对 集合 W 的 弱 要 求 。 并 非 传 输 每 个 有 效 的 消息 ， 进 程 p 至 多 转 
发 两 条 消息 ， 即 一 条 消息 带 有 p 所 接收 的 第 一 个 值 ， 另 一 条 消息 带 有 p 所 接收 的 第 二 个 值 。 算 
法 的 完整 描述 留 给 读者 。 

定理 15.11 .上面 描述 的 Dolev 和 Strong 算 法 是 Byzantine 广 播 协议 ， 利用 ! +1 个 脉冲 和 至 多 
2 和 NN? 条 消息 。 

证 明 。 因 为 每 个 正确 进程 在 第 + +1 个 脉冲 结束 时 判定 ， 因 此 终止 性 和 同时 性 和 以 前 协议 相 
同 。 相 关 性 也 可 由 以 前 协议 而 得 。 如 果 8 在 第 一 个 脉冲 中 正确 地 向 所 有 近邻 发 送 *， 那 么 在 那 
个 脉冲 中 ， 所 有 正确 进程 接受 v， 而 不 接收 其 他 值 。 因 此 所 有 正确 进程 对 v 判 定 。 由 每 个 ( 正 
fi) 进程 向 所 有 近邻 至 多 发 送 两 条 消息 这 样 一 个 事实 ， 可 得 所 声称 的 消息 复杂 度 。 

为 了 证 明 一 臻 性， 我们 应 证 明 ， 对 于 正确 进程 Pp 和 g， 在 第 + +1 个 脉冲 结束 时 ，W, 和 W, 满 
足以 下 条 件 。 

(1) 如 果 W, = {v}， 那 么 v E W, 

(2) 如 果 #W, > 1， 那 么 #W, > 1。 

对 于 (1): 假设 p 在 脉冲 i 中 一 旦 接 到 消息 <value，、v>: g: px.: p;， 就 接受 值 ， 推 理 过 
程 如 同 定理 15.10 的 证 明 。 

情形 1: 如 果 q 出 现在 8g，...，p: 中 ， 那 么 4 明确 地 接受 

情形 2: 如 果 4 没有 出 现在 序 Pole, ..., pth, Hi<t, “Waphate Rit. 在 这 种 情形 下 ,2 
将 接受 它 。 

情形 3: 如 果 4q 没 有 出 现 ， 且 i = + +1， 至 少 对 消息 签名 的 一 个 进程 :是 正确 的 。 进 程 /已 经 
向 4 转发 值 *"， 列 含 着 v 在 风 , 中 。 

对 于 (2): 假设 算法 结束 时 ，#W, > 1， 并 设 w 是 p 接 收 的 第 二 个 值 。 由 类 似 推理 可 以 证 明 ， 
VE W。 这 草 含 着 #W, > 1。( 不 能 导出 W, 和 W, 的 相等 性 ， 因 为 进程 p 不 会 转发 所 接收 的 第 三 
值 或 其 后 所 接收 的 值 。) 

已 经 证 明了 (1) 和 (2), 假设 正确 进程 p 对 y © WHI. BNW, = {v}. WAH (1), vik 
包含 在 正确 进程 9 的 所 有 W, 中 ， 但 是 由 此 可 得 W, 不 会 大 于 孤 集 {y}; 否则 由 (2)， 了 ,不 是 孤 集 。 
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因此 ， 每 个 正确 进程 q 也 对 v 判 定 。 进 一 步 假设 正确 进程 p 对 默认 值 进行 判定 ， 是 因为 W, 不 是 孤 
集 。 如 果 W, 是 空 集 ， 由 (1)， 每 个 正确 进程 9 使 W, 为 空 ， 并 且 由 (2)， 如 果 #W, > 1, BBA 
#W,> 1， 因 此 ，4 也 对 默认 值 进行 判定 。 

Dolev 和 Strong 进 一 步 改 进 了 算法 ， 并 得 到 解决 Byzantine- 广 播 问 题 的 一 个 算法 ， 具 有 相同 
的 脉冲 数 ， 只 用 O(Ni) 条 消息 。 


15.2.2 数字 签名 的 实现 


因为 p 的 签名 5, (M) 应 该 构成 足够 多 的 证 据 ， 可 证 明 p 是 消息 的 初始 者 ， 签 名 必须 由 某 种 
形式 的 信息 组 成 ， 这 种 信息 

(1) 可 由 p 进 行 有 效 的 计算 (24). 

(2) 除了 p 之 外 ， 其 他 进程 不 能 对 它 进行 有 效 的 计算 (伪造 )。 

我 们 立刻 会 注意 到 ， 对 于 今天 所 用 的 大 多 数 签 名 模式 ， 在 某 种 程度 上 ， 第 二 个 要 求 没 有 
被 证 明 ， 就 是 伪造 问题 具有 指数 级 难度 。 通 党 伪造 问题 被 证 明 与 某 些 计算 问题 有 关 (有 了 时 等 
价 )， 而 这 些 计算 问 题 已 经 被 研究 了 很 长 时 间 ， 还 没有 得 到 多 项 式 解 。 例 如 ， 在 Fiat-Shamir 模 
式 中 ， 伪 造 签名 可 以 对 大 的 整数 进行 因子 分 解 ， 因为 后 者 (假定 ) 计算 上 是 有 难度 的 ， 前 者 
一 定 也 有 计算 上 的 难度 。 

基于 各 种 假定 的 难 解 问题 ， 提 出 了 签名 模式 ， 例 如 计算 离散 对 数 、 大 数 因子 分 解 以 及 背 
包 算 法 。 要 求 (1) 和 (2) 蕴含 着 ， 与 其 他 进程 相 比 ， 进 程 p 必 须 有 计算 上 的 “优势 "。 这 个 
优势 是 一 些 秘密 信息 ， 由 p 保 留 ， 称 为 p 的 害 铀 或 者 私 铀 。 于 是 当 密 钥 已 知 时 ，5S,(M) 的 计算 
是 有 效 的 。 而 没有 这 个 信息 ,计算 就 (假设 ) 是 困难 的 。 显 然 ， 如 果 p 成 功 地 保守 了 它 的 秘密 ， 
只 有 P 能 够 顺利 地 计算 9 (M). 

所 有 进程 必须 能 够 验证 签名 ， 即 ， 给 定 消息 M 和 签名 9， 必 须 能 够 有 效 地 验证 ，$ 确 实 是 
利用 p 的 密 钥 对 消息 M 计 算 而 得 。 这 种 验证 要 求 揭 示 关 于 p 的 某 些 密 钥 的 信息 。 称 这 种 信息 为 p 
的 公 铀 (public key)。 公 铀 允许 对 签名 进行 验证 ， 但 是 可 能 的 或 至 少 计算 上 是 有 难度 的 ， 利 
用 公 钥 计算 p 的 密 钥 或 者 伪造 签名 。 

到 目前 为 止 ， 最 成 功 的 签名 模式 是 基于 在 算术 环 中 模 大 数 的 数论 计算 。 在 这 些 环 中 可 以 
执行 基本 的 算术 操作 ， 如 ， 加 、 乘 和 求 千 运 算 ， 时 间 复杂 度 为 ( 按 位 ) 模 长 度 的 多 项 式 时 间 。 
如 果 分 母 与 模 互 素 ( 即 ， 没 有 公共 素 因子 )， 做 除法 也 是 可 能 的 ,并且 也 可 用 多 项 式 时 间 完 成 。 
因为 签名 和 验证 要 求 对 消息 进行 计算 ， 因 此 可 将 M 解 释 为 一 个 大 数 。 


15.2.3 ElIGamal 签 名 模式 


EIGamal 签 名 模式 [E1G85] 是 基于 称 为 离散 对 数 (discrete logarithm) 的 数论 函数 。 对 于 大 
ERP, 用 Z', 表 示 的 模 P 的 乘法 群 ， 包 含 P-1 个 元 素 ， 且 是 循环 的 。 后 者 的 含义 是 ， 选 择 元 素 
8 EZ", WREIXP-14 HK, 














P-3 P-2 
’ 


8° =1,8',87,...8° 8 
互 不 相同 ， 因 此 枚 举 Z', 中 的 所 有 元 素 。 称 这 样 的 g 为 Z', 的 生成 元 (generator), 也 称 模 P 的 原 
4k (primitive root)。 生 成 元 不 是 惟一 的 ， 通 常 有 多 个 生成 元 。 给 定 国定 数 P 和 生成 元 ge HE 
每 一 个 x E Z， 存 在 模 P-1 的 惟一 整数 i， 满 足 g = x (等 式 在 Z 中 )。 称 这 个 为 xz 的 离散 对 数 
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(有 时 称 下 标 )。 与 上 述 提 到 的 基本 算术 操作 不 同 ， 这 些 离散 对 数 的 计算 是 不 容易 的 。 这 是 一 
个 到 目前 为 止 ， 经 过 研究 ， 仍 未 找到 有 效 通用 解决 方法 的 问题 ， 但 是 这 个 问题 也 没有 被 证 明 
是 难 解 的 。 文 献 [Odl84] 有 对 结果 的 概述 。 

ElGamal[ELG85] 签 名 模式 是 基于 计算 离散 对 数 的 难度 。 进 程 共享 大 素数 P 和 2 的 一 个 原 
根 g。 进 程 p 在 1 和 P-2 之 间 随 机 地 选择 一 个 数 d 作 为 它 的 密 钥 ，p 的 公 钥 为 e = 9% 观察 可 见 ，d 
是 e 的 离散 对 数 。 已 知 e 的 对 数 ， 可 以 有 效 地 计算 p 的 签名 。 于 是 形成 一 个 隐 含 证 明 ， 即 ， 签 名 
者 知道 d。 

对 于 消息 M 的 有 效 签名 模式 是 数 对 (r，s )， 满 足 8”= er”"。 利 用 密 钥 4，p 很 容易 找到 这 
样 的 数 对 。 进 程 p 选 择 一 个 随机 数 a， 且 该 数 与 P-1 互 素 ， 计算 


r=g° (mod P) 
且 

s=(M-dr)a" (mod (P-1)) 
这 些 数 确实 满足 | 


eer ze (g “ur” 
= gi gh © =g" 
(所 有 等 式 在 Z', 中 。) 通过 检查 是 否 g*” =e - 产 ， 很 容易 验证 对 消息 M 签 名 8 = (r, s) 的 有 
效 性 。 
1. 离散 对 数 算法 
因为 p 的 密 钥 d 等 于 它 的 公 钥 e 的 离散 对 数 ， 如 果 模 P 的 离散 对 数 能 被 有 效 地 计算 ， 则 很 容 
易 破 解 这 种 模式 。 到 目前 为 止 ， 一般 情况 下 ， 还 没有 有 效 的 算法 能 做 到 这 一 点 ， 或 者 用 任何 
其 他 方法 伪造 签名 。 l 
计算 离散 对 数 的 一 般 算 法 是 由 Odiyzko[Od184] 提 出 的 。 它 的 复杂 度 和 最 著名 的 整数 P 的 因 
子 分 解 具有 相同 的 数量 级 。 算 法 首先 只 利用 P 和 8 来 计算 几 张 表 ， 在 第 二 步 ， 计 算 给 定数 的 对 
数 。 如 果 Q 是 P-1 中 的 最 大 素 因 子 ， 那 么 第 一 步 的 计算 时 间 及 表 的 大 小 与 G0 具有 相同 的 数量 级 。 
因此 ， 应 选择 P， 满足 P-1 中 有 大 的 素 因 子 。 第 二 步 计 算 对 数 ， 甚 至 在 很 小 的 计算 机 上 只 需 几 
秒 就 可 完成 。 因 此 需要 经 常 充 分 地 改变 P 和 8 ， 比 如 每 个 月 ， 使 得 在 它们 的 计算 完成 之 前 ， 针 
对 某 个 特定 的 P 的 表 已 经 过 时 。 
2. 随机 签名 
签名 过 程 的 随机 化 ， 可 以 使 得 对 于 给 定 的 消息 ，G(P-1) 个 不 同 签名 “出 现 的 概率 相同 。 
因此 ， 对 于 签 过 两 次 名 的 同一 个 文档 ， 几 乎 肯定 会 产生 两 个 不 同 的 有 效 签 名 。 在 签名 过 程 中 ， 
随机 化 是 至 关 重要 的 。 如 果 p 利 用 同一 个 值 a 为 两 个 消息 签名 , 那么 由 签名 可 以 计算 出 p 的 密 钥 。 
参见 习题 15.6。 


15.2.4 RSA 签 名 模式 
如 果 " 是 个 大 整数 ， 是 两 个 素数 P 和 0 乘积 ， 则 计算 模 " 的 平方 根 和 更 高 阶 根 是 相当 难 的 ， 
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除非 已 知 其 中 的 因子 分 解 。 可 以 利用 计算 平方 根 的 能 力 找 出 的 因子 (参见 习题 15.7)， 这 证 
明了 平方 根 的 计算 和 因子 分 解 一 样 困难 。 

在 Rivest、Shamir and Adleman[RSA78] 提 出 的 签名 模式 中 ，p 的 公 和 钥 是 一 个 大 数 n， 且 p 知 
道 其 中 的 因子 分 解 和 一 个 指数 e。p 对 消息 M 的 签名 是 MM 的 第 e 个 根 ( 模 n)， 利 用 求 矫 计算 对 此 
很 容易 验证 。P 也 能 利用 求 赛 计 算 找 出 高 阶 根 。 当 生成 它 的 钥匙 时 ，P 计 算 一 个 数 4， 满 足 de = 
I(mod(O(n)), KAZE (M1) = M， 即 MM 是 M 的 第 e 个 根 。P 的 密 钥 只 由 数 d 组 成 ， 即 p 不 需 
要 记 住 x 的 因子 分 解 。 

在 RSA 模 式 中 ，p 通 过 计算 模 n 的 根 表明 它 的 标识 ， 这 ( 隐 含 ) 要 求知 道 关 于 "的 因子 分 解 。 
只 有 p 被 假定 共有 这 个 知识 。 在 这 种 模式 中 ， 每 个 进程 利用 不 同 的 模 。 


15.2.5 Fiat-Shamir 签 名 模式 


Fiat 和 Shamir[FS86] 提 出 的 模式 中 更 微妙 地 用 到 了 求 (平方 ) 根 的 难度 。 在 RSA 模 式 中 ， 
进程 的 签名 ， 是 通过 证 明 它 能 够 计算 根 ( 模 公 钥 ) 来 完成 的 。 假 定 计算 根 的 能 力 要 求 因子 分 
解 知识 。 在 Fiat-Shamir 签 名 模式 中 ， 进 程 利用 了 公共 模 数 x， 其 中 的 因子 分 解 只 对 可 信和 的 中 心 
而 言 是 可 知 的 。 已 知 某 些 特 定数 (依赖 p 的 标识 ) 的 平方 根 为 进程 p 所 知 ，p 对 MM 的 签名 提供 了 
签名 者 知道 这 些 平 方 根 的 证 据 ， 但 并 未 揭示 这 些 方 根 是 什么 。 

Fiat-Shamir 签 名 模式 优 于 RSA 模 式 的 优势 在 于 ， 它 共有 较 低 的 算术 复杂 度 ， 并 且 每 个 进 
程 没有 单独 公 钥 。 缺 点 是 需要 一 个 可 信 权 威 机 构 来 分 发 这 些 密 钥 。 正 如 以 前 所 提 到 的 ， 模 
式 利用 了 大 整数 *， 是 仅 为 中 心 所 知 的 两 个 大 素数 的 乘积 。 另 外 ， 存 在 一 个 单 向 伪 - 随 机 函 
数 f/， 将 串 映射 到 Z, 上 。 这 个 函数 是 已 知 的 ， 每 个 进程 都 可 计算 它 。 但 是 它 的 逆 函 数 是 不 能 
计算 出 的 。 

1. BAMOA 

作为 密 钥 ， 给 定 k 个 模 n 的 数 s, 到 s, 作 为 p 的 方 根 ， 即 s; = Jre 其 中 ,vj =f(p, i). TAE 
yw 作为 p 的 公 钥 ,但 是 因为 它们 可 由 p 的 标识 计算 而 得 ， 因 此 不 需要 存储 enn. 为 了 避免 技术 上 
的 麻烦 ， 我 们 假设 这 * 个 数 都 是 模 n 的 二 次 剩余 。 平 方 根 可 由 中 心 进行 计算 ， 它 知道 的 因子 。 

2. 签名 消息 : 首次 尝试 

P 的 签名 隐 含 地 证 明了 签名 者 知道 的 根 ， 即 它 可 提供 一 个 数 s 满 足 s2y; = 1。 这 个 数 就 是 s,， 
但 是 发 送 9 自身 可 能 暴露 密 钥 。 为 了 避免 暴露 密 钥 ， 模 式 利用 了 以 下 的 思想 。 进 程 p 选 择 随机 
数 r-， 并 计算 x = r?。 现 在 p 是 惟一 能 够 提供 满足 y? v = x 的 数 y 的 进程 ， 即 y = rw。 因 此 ， 通 过 发 
XM Ey v = x 的 数 对 (x，y)，p 可 以 证 明 它 对 s, 有 所 知 ， 而 不 会 暴露 它 。 由 于 p 没 有 发 送 数 7， 
不 计算 平方 根 ， 而 从 这 个 数 对 计算 s 是 不 可 能 的 。 

但 是 由 这 样 的 数 对 组 成 的 签名 ， 存 在 两 个 问题 。 第 一 ， 任 何 进程 都 可 以 按照 以 下 方法 通 
过 欺骗 产生 这 样 的 数 对 : 首先 选择 y， 然 后 计算 x = yxv。 第 二 ， 签 名 并 不 依靠 消息 ， 因 此 接收 
来 自 p 的 签 过 名 的 消息 的 进程 可 以 把 这 个 签名 拷贝 到 任何 伪造 消息 中 。 签 名 模式 的 关键 是 使 p 
表明 ， 它 知道 ”的 一 个 子 集 乘积 的 根 ， 而 子 集 依 靠 消息 和 随机 数 。 消息 的 不 规则 性 以 及 通过 / 
的 随机 数 可 以 防止 伪造 者 首先 选择 y。 

为 了 对 消息 M 签 名 ，p 进 行 如 下 计算 。 

(1) p 选 择 随 机 数 r-， 并 计算 x =r’. 

(2) p 计 算 1( M，x) ; 前 k 位 是 e! 到 ei。 
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(3) pity =r] s, 

ZAS (M) 由 元 组 (e，…，ee y) 组 成 。 

-为 了 验证 p 对 消息 M 的 签名 (eli，…，ekt，?7) ， 进 行 如 下 计算 。 

(1) 计算 wz = TT. 

(2) 计算 +(M，z)， 并 且 验 证 前 位 是 e 到 ei。 

如 果 签 名 是 真实 的 ， 那 么 在 验证 的 第 一 步 中 所 计算 的 z 值 等 于 签名 中 所 用 的 x 值 。 因 此 , f 
(M, z) 的 前 位 等 于 el，...，er。 

3. 伪造 和 最 终 解 

我 们 现在 考虑 一 种 策略 ， 一 个 伪造 者 在 不 知道 5 的 情况 下 ， 按 照 上 述 的 模式 获得 一 个 签名 。 

(1) 选择 k 个 随机 位 e1，...，ex。 

(2) 选择 随机 数 y， 并 计算 x = y fv 

(3) 计算 1(M，x)， 并且 验证 它 的 前 位 是 否 等 于 之 前 选择 的 e!/，...，e:。 如 果 相等 ， 那 么 
(eis sey Ces y) 是 对 消息 M 的 伪造 签名 。 

由 于 可 以 假设 第 (3) 步 中 相等 的 概率 为 2*， 那 么 经 过 预期 的 2: 次 试验 后 ， 伪 造成 功 。 

MURA = 72, 并 假设 需要 10 秒 来 试验 对 e 的 一 次 选择 , 伪造 所 需 的 期 望 时 间 为 2? . 10-? 秒 ， 
或 者 一 百 五 十 万 年 ， 这 使 得 模式 很 安全 。 然 而 ， 每 个 进程 必须 存储 k 个 根 ， 并 且 由 于 空间 的 限 
制 ， 如 果 k 值 必须 是 有 限 的 ， 预 期 的 2: 伪 造 时 间 可 能 是 不 能 令 人 满意 的 。 我 们 现在 证 明 如 何 修 
改 这 个 模式 ， 以 便利 用 k 个 根 ， 对 于 所 选择 的 整数 :， 获 得 期 望 值 为 2 的 伪造 时 间 。 设 想 利用 所 
结果 的 前 kt 位 ， 定 义 v 的 个 子 集 合 ， 使 p 表 明 它 有 i 个 这 些 子 集 的 乘积 知识 。 为 了 对 消息 M 签 名 ， 
Pp 进行 如 下 计算 。 

(1) p 选 择 随 机 数 r,，...，r,， 并 计算 x; = 3。 

(2) pitBf(M, xis s 4), BWA He; (1< i< tHI< j<k)。 

(3) 对 于 1 <i<t, pity; = nL 1536 ES, (M) 由 元 组 len, o, ex, Yis os yr) 
组 成 。 

为 了 验证 p 对 消息 M 的 签名 (en，...，enx，y1，.…，y,)， 进 行 如 下 计算 。 

(1) 计算 w 且 z= yev 

(2) 计算 f (MM， Zo vey Z), 并 且 验 证 前 kt 位 是 ei， -> Cko 

在 第 三 步 中 ,试图 用 如 上 所 述 的 策略 ， 产 生 一 个 有 效 签名 的 伪造 者 ， 其 成 功 概率 为 2-*， 
这 维 含 预期 的 试验 数 为 2%*。Fiat 和 Shamir 在 他 们 的 论文 中 证 明 ， 除 非 对 n 的 因子 分 解 变 得 容易 ， 
否则 不 存在 本 质 上 更 好 的 伪造 算法 ， 因 此 只 要 选择 k 和 t 足 够 大 ， 就 可 以 使 模式 是 安全 的 。 


15.2.6 概述 和 讨论 


本 节 以 及 前 一 节 已 经 表明 ， 对 于 Byzantine 广 播 问 题 ， 在 同步 系统 中 存在 确定 解 。 如 果 不 
用 鉴别 (15.1 节 ) ， 这 个 解 的 最 大 弹性 为 ! < N/3， 而 如 果 使 用 消息 鉴别 (本 节 )， 那 么 这 个 弹 
性 是 无 限 的 。 这 里 所 给 出 的 所 有 解 中 ， 我 们 -- 直 用 脉冲 模型 假设 来 模拟 同步 过 程 。 在 15.3 节 
讨论 了 脉冲 模型 的 容错 实现 。 

1. 触发 组 问题 

除了 假设 脉冲 模型 ， 第 二 个 目前 所 给 出 的 所 有 解决 方法 所 基于 的 假设 是 ， 所 有 进程 知道 
在 哪 一 个 脉冲 中 开始 广播 (为 方便 起 见 ， 标 号 为 1) 。 如 果 这 不 是 预先 的 情况 ， 那 么 在 一 个 或 
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者 多 个 进程 (自发 地 ) 开始 执行 广播 算法 的 一 个 执行 请 求 之 后 ， 会 引起 同时 开始 执行 算法 的 
问题 。 请 求 可 能 来 自 将 军 〈 计 算出 一 个 必须 向 所 有 进程 宣布 的 结果 之 后 ) ， 或 者 来 自 中 尉 〈 认 
识 到 它们 都 需要 存储 在 将 军 中 的 信息 )。 文 献 中 这 个 问题 是 作为 触发 组 问题 加 以 研究 的 。 在 这 
个 问题 中 ， 一 个 或 者 多 个 进程 开始 执行 (请 求 )， 但 不 必 是 在 同一 个 脉冲 中 ， 进 程 可 能 被 触发 
(fire), BRE: 

(1) 有 效 性 除非 某 些 进程 已 经 开始 执行 ， 否 则 没有 正确 进程 触发 。 

(2) 同时 性 如 果 任 一 正确 进程 触发 ， 那 么 所 有 正确 进程 在 同一 个 脉冲 中 触发 。 

(3) 终止 性 如 果 一 个 正确 进程 开始 执行 ,那么 所 有 正确 进程 在 有 限 个 脉冲 内 触发 。 

实际 上 ， 给 定 触发 组 问题 的 解 ， 广 播 的 第 一 个 脉冲 无 需 预先 达成 一 致 ， 请 求 广播 的 进程 
开始 执行 触发 组 算法 ， 并 且 广 播 在 触发 之 后 的 脉冲 中 开始 。 可 以 把 在 Byzantine- 广 播 问 题 和 触 
发 组 问题 解 中 所 用 的 技术 组 合 ， 得 到 更 有 时 效 的 协议 ， 即 ， 在 没有 关于 第 一 个 脉冲 的 优先 -- 
致 性 的 情况 下 ， 可 以 直接 地 求解 广播 问题 。 

2. 时 间 复 杂 度 和 提前 停止 协议 

本 章 中 ， 我 们 已 经 给 出 了 利用 + +1 或 2f +3 个 脉冲 或 进行 数 轮 通信 的 协议 。Fischer and 
Lynch[FL82] 已 经 证 明 ， 对 于 -健壮 一 致 协议 ，t +1 轮 的 通信 是 最 优 的 ， 并 对 这 一 结果 作 了 扩 
FR, Mi T Dolev and StrongfDS83] 提 出 的 鉴 别 协 议 。 

在 这 些 证 明 中 , 细微 之 处 在 于 , 在 所 使 用 的 情形 中 进程 一 定 会 在 脉冲 1 至 脉冲 :中 发 生 故 障 。 
因此 下 界 是 执行 过 程 中 实际 故障 数 最 坏 情况 。 因 为 在 大 多 数 执行 中 ， 实 际 故 障 数 要 比 弹 性 更 
低 ， 已 经 研究 了 是 否 存在 在 只 有 少量 故障 的 那些 执行 中 能 够 较 早 达到 一 致 性 的 协议 。 具 有 这 
种 性 质 的 广播 协议 称 为 提前 停止 (early stopping) 协议 。 对 于 有 /个 故障 的 一 次 执行 中 的 协议 ， 
Dolev, Reischuk and Strong[DRS82] 证 明了 一 个 +2 轮 的 下 界 。 在 文献 [BGP92] 中 ， 可 以 找到 
几 个 关于 提前 停止 广播 性 协议 和 一 致 性 协议 的 讨论 。 

在 正确 进程 断定 已 经 有 某 个 脉冲 没有 出 现 新 故障 后 的 几 个 脉冲 内 ， 早 停 协 议 进 行 判定 。 
然而 ,不 能 保证 ， 所 有 正确 进程 在 同一 个 脉冲 都 得 出 这 个 结论 。( 除非 它们 在 第 + +1 个 脉冲 中 
进行 判定 ， 因 为 至 多 有 + 个 进程 发 生 故 障 ， 则 在 前 ! +1 轮 中 ， 存 在 没有 出 现 新 故障 的 一 轮 。) 因 
” 此 ， 早 停 协 议 并 不 满足 同时 性 。Coan and Dwork[CD91] 证 明 ， 为 了 达到 同时 性 ， 在 执行 中 ，1 
+1 轮 不 出 现 新 故障 是 必要 条 件 ， 甚 至 对 于 随机 协议 和 在 (非常 弱 的 ) HAGA ch th Ba RE. 
这 前 含 着 经 鉴别 的 协议 也 需要 1 +1 个 脉冲 来 达到 同时 性 。 

3. 判定 问题 和 交互 一 致 性 

利用 广播 协议 作为 子 例 程 ， 实 际 上 ， 在 同步 系统 中 ， 通 过 达到 交互 一 致 性 (interactive 
consistency)， 可 以 解决 所 有 判定 问题 ， 即 ， 输 入 集 上 的 一 致 性 。 在 交互 一 致 性 问题 中 ， 进 程 
对 和 输入 的 向 重 进行 判定 ， 系 统 中 的 每 个 进程 一 个 输入 。 形 式 上 ， 有 如 下 要 求 : 

(1) 终止 性 每 个 正确 进程 p 对 向 量 岂 进行 判定 ， 每 个 进程 一 个 输入 。 

(2) 一 致 性 正确 进程 的 判定 向 量 是 相等 的 。 

(3) 相关 性 如 果 g 是 正确 的 ， 那么 对 于 正确 进程 p»，V,[q] = x, 

通过 多 次 广播 ， 可 以 实现 交互 一 致 性 : 每 个 进程 广播 它 的 输入 ， 并 且 进程 p 把 它 在 4 的 广 
播 中 的 判定 放 在 V,[9] 中 。 从 广播 算法 的 相应 性 质 ， 终 止 性 、 一 致 性 和 相关 性 直接 被 继承 。 

因为 每 个 正确 进程 计算 同一 个 向 量 (一 致 性 )， 利 用 关于 判定 向 量 (该 向 量 可 以 立即 保证 
一 致 性 ) 的 确定 函数 ， 可 以 容易 地 解决 大 多 数 的 判定 问题 。 例 如 ， 可 以 抽取 判定 向 量 的 大 多 
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数值 ， 即 可 解决 一 致 性 问题 。 在 判定 向 量 中 选择 最 小 惟一 标识 可 以 解决 选举 问题 (注意 ， 所 
选 的 进程 可 能 是 有 故障 的 )。 


15.3 ”时钟 同步 


前 节 证 明 ，( 当 考虑 确定 算法 时 ) 同步 系统 比 异 步 系统 具有 更 高 的 弹性 。 对 于 理想 同步 模 
型 ， 其 中 进程 按照 脉冲 执行 ， 得 出 了 这 一 结果 。 脉 冲模 型 具有 更 高 弹性 蕴含 着 ， 不 可 能 用 健 
壮 方法 确定 地 同步 完全 异步 网 络 。 本 节 将 证 明 ， 在 异步 有 限 延 迟 网 络 (ABD 网 络 ) 中 实现 健 
壮 的 脉冲 模型 是 可 能 的 。 

ABD 模 型 被 为 局 部 时 钟 可 用 和 消息 延迟 有 上 界 。 在 算法 描述 和 分 析 中 ， 我 们 利用 实时 
#i (real-time frame )， 它 是 对 每 个 事件 赋 给 一 个 发 生 时 间 !E 有 R。 按 照相 对 物理 学 ， 不 存在 标 
准 的 或 者 特定 的 方法 来 进行 这 个 赋值 。 下 面 我 们 假设 ,已 经 选择 了 具有 物理 意义 的 赋值 。 
系统 中 的 进程 不 能 看 到 实时 帧 ， 但 是 进程 可 以 利用 它们 的 时 钟 间 接地 观察 到 时 间 。 时 钟 的 
值 与 实时 时 间 有 关 。 用 C, 表 示 进 程 p 的 时 钟 ， 进 程 p 可 以 对 它 进行 读 写 (向 时 钟 写 需 要 同步 ) 。 
当时 钟 没有 被 赋值 时 ， 时 钟 值 按 照 时 间 连 续 变 化 。C, (t) = 7 表示 在 实时 时 间 t， 读 出 时 钟 值 
为 T。 

ABFE (C, T) 用 于 表示 时 钟 时 间 ， 小 写字 母 (c，#) 用 于 表示 实时 时 间 。 有 时 钟 可 用 
于 控制 事件 的 发 生 ， 如 在 


when C, = T then send message 


时 ， 引 起 在 时 间 C,-!' (7T) 发 送 消 息 。 用 cy 表示 函数 C1。 

理想 时 钟 值 按照 A 个 时 间 单 位 每 次 增加 A。 即 它 满足 C(t +A) = C(T = 1) +A。 理 想 时 钟 ， 
一 旦 同步 再 不 需要 调整 、 但 遗憾 的 是 ， 它 们 只 是 一 种 (有 用 的 ) 数学 抽象 。 分 布 式 系统 中 所 
用 的 时 钟 会 遭受 漂移 (drift)， 但 漂移 限定 在 一 个 小 的 已 知 常数 p 的 范围 内 (典型 情况 下 ， 阶 
为 10-5 或 10)。 时 钟 C 的 漂移 是 p- 有 界 的 ， 如 果 对 于 5 和 口 ， 满 足 对 C 的 赋值 不 会 出 现在 2 和 记 
之 间 。 


(t-t,)(1 +p)" < C(t) -C(t1) < (h-t,) (1 +p) (15-1) 
在 任何 给 定 的 实时 时 间 ， 分 布 式 系统 中 的 各 种 时 钟 并 不 能 显示 相同 的 时 钟 时 间 。 即 C,(1) 
=C,(t) 不 必 成 立 。 如 果 IC, (t) -Cs (1) 1< 5， 则 在 实时 时 间 t 了 时 钟 是 6- 同步 的 。 如 果 Ic, (T)-c, 
(T) 1 6， 则 在 时 钟 时 间 7 时 钟 是 5- 同 步 的 。 我 们 将 把 这 些 表示 视 为 等 价 的 。 参 见习 题 15.8。 
时 钟 同 步 算法 的 目标 是 达到 和 维持 全 局 6 同步 。 即 在 每 一 对 时 钟 之 间 6- 同 步 。 参 数 6 是 同步 的 
精度 。 
6nin 表 示 消 息 延 迟 下 界 ， 0 表示 消息 延迟 上 界 ， 其 中 0< Sain <Omnax > 形式 地 ， 如 果 在 实时 
时 间 o 发 送 一 条 消息 ， 在 实时 时 间 了 接收 这 条 消息 ， 那 么 
Smin < T-0 L Omar (15-2) 
因为 实时 时 间 帧 的 选择 是 任意 的 ， 假 设 式 (15-1) 和 式 (15-2) 与 时 间 帧 以 及 时 钟 和 通信 
系统 相关 。 


15.3.1 读 取 远程 时 钟 
本 节 研 究 进程 p 利 用 精度 ， 将 自身 理想 时 钟 调整 成 可 靠 服 务 器 的 理想 。 利 用 确定 协议 ， 
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能 达到 的 最 好 精度 是 1/2( 6%x-6mn)。 这 个 精度 可 以 通过 只 交换 一 条 消息 的 简单 协议 达到 。 概 
率 协 议 可 以 达到 任意 精度 ,但 消息 复杂 度 依赖 于 所 要 求 的 精度 和 消息 传输 时 间 的 分 布 。 


情形 ! 


情形 2 


T 
图 15-5 确定 协议 的 情形 


定理 15.12 存在 以 精度 1/2( Öman) 同步 C 到 C, 的 确定 协议 ， 只 交换 一 条 消息 。 不 存在 
达到 更 高 精度 的 确定 协议 。 

证 明 。 我 们 首先 提出 一 个 简单 协议 ， 并 证 明 它 达到 了 定理 中 所 声称 的 精度 。 为 了 使 C, 辐 
步 ， 服 务 器 发 送 一 条 消息 <time，C,>。 当 进程 p 接 收 到 消息 <time，7> 时 ， 就 将 它 的 时 钟 调整 
BIT +1/2( Smax + Omin) o 

为 了 证 明 所 声称 的 精度 ， 称 发 送 和 接收 消息 <time，7> 的 实时 时 间 分 别 为 o 和 Tt。 现 在 ， 
T= C, (0)。 因 为 时 钟 是 理想 的 ，C, (Tt) = T+ (za)。 在 时 间 r，p 将 它 的 时 钟 调整 到 C, (7) 
= T +1/2( max +6min)， 因 此 , C, (7T)-C, (tT) = (t-0) -1U2(6 +4min) o FLIE Âmin < T-O L Ô imax 
HA BIC, (1) -Cr (T) 1< 1/2( max Smin ) o 

为 了 证 明 精 度 的 下 界 ， 设 给 定 确定 协议 。 在 这 个 协议 中 ，p 和 s 交 换 某 些 消息 ， 交 换 之 后 ， 
Pp 调 整 它 的 时 钟 。 考 虑 协议 的 两 种 情形 ， 如 图 15-5 所 示 。 在 第 一 种 情形 中 ， 执 行 之 前 ， 时 钟 是 
相等 的 ， 从 s 到 p 的 所 有 消息 在 6%in 之 后 传输 ， 而 从 p 到 s 的 所 有 消息 在 6 之 后 传输 。 如 果 在 这 
种 情形 中 所 做 的 调整 是 Al1， 那 么 同步 之 后 ，p 的 时 钟 比 C, 恰 好 提前 Ai。 

在 第 二 种 情形 中 ， 执 行 之 前 ，Cb 比 C, 落 后 6%。-6ms。 从 p 到 s 的 所 有 消息 在 6mis 之 后 传输 ， 
而 从 * 到 p 的 所 有 消息 在 5 之 后 传输 。 称 在 这 种 情形 下 所 做 的 调整 是 入， 那么 同步 之 后 ， 我 们 
RAR, WZ DAI BE HF LL CHE IB Ôm Öm Aro 

然而 ，P 或 者 r 都 不 能 发 现 这 两 种 情形 之 间 的 差异 ， 因 为 消息 延迟 的 不 确定 性 掩盖 了 这 种 
差异 ， 因 此 ，A =A。 这 蕴含 着 最 坏 情 况 下 的 最 好 精度 为 


minmax(l Al, 16,,. ~- 6., ~ Al) 


这 个 最 小 值 等 于 1/2( Öm Ânn) (4A =1/2 (Sannin) 时 出 现 最 小 值 )。 a 
如 果 两 个 进程 p 和 4 都 以 这 个 精度 将 它们 的 时 钟 与 服务 器 同步 ， 就 可 达到 全 局 (66 ) 
同步 ， 对 于 大 多 数 应 用 ， 这 已 足够。 
CristianfCri89] 提 出 了 一 种 概率 同步 协议 ， 可 以 达到 更 好 的 精度 。 对 于 这 个 协议 ， 假 设 消 
息 延 迟 是 一 个 随机 变量 ， 按 照 函 数 (不 必 已 知 ) FP [om，6uu]-*[0，1] 分 布 。 任 何 消息 到 过 x 





内 的 概率 为 F(z)， 且 不 同 消息 的 延迟 是 独立 的 。 如 果 下 界 5 是 紧 的 ， 则 可 达到 任意 的 精度 ， | 
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即 ， 对 于 所 有 x >6%in,， F(x) > 0. 

协议 很 简单 ，p 要 求 s 发 送 时 间 ， 而 s 并 即 用 消息 <time，T> 进 行 响应 。 进 程 p 测 量 发 送 请 求 
和 接收 响应 之 间 的 时 间 1，1> 26m 成 立 。 响 应 消息 的 延迟 至 少 为 6mw， 至 多 为 /-6%。， 因 此 至 多 
与 (1/2)1 相 差 (1/2) (1-26wn)。 于 是 p 可 以 将 它 的 时 钟 设置 到 T + 1/2)7， 并 达到 精度 ( 12) 六 
26mn)。 假 设 所 需 的 精度 是 e， 如 果 ( 1/2)( 26%)>e， 进 程 p 发 送 一 个 新 的 请 求 ， 否 则 算法 终止 。 


引 理 15.13 概率 时 钟 -同步 协议 以 至 多 为 F( 6min te) 的 期 望 消息 数 ， 达 到 精度 E。 

证 明 。 进 程 p 的 请 求 在 6% +e 内 到 术 的 概率 为 F( Omin +s)， 响 应 在 6w +e 内 到 达 的 概率 也 为 
F( Onin +e)。 因 此 ， 进 程 p 在 26%s + 2e 内 接收 这 个 响应 的 概率 至 少 为 F( Onin te), KAS E 
行 成 功 消息 交换 之 前 ， 所 期 望 的 试验 数 界限 为 F( Omin +E) 2 

如 果 p 发 送 新 的 请 求 ， 发 送 之 后 ， 如 果 在 26ws +2z 内 没有 收 到 上 应 ， 则 协议 的 时 间 复 杂 
减少 。 期望 时 间 独 立 于 期 望 延迟 或 最 大 延迟 ， 即 2( ón te) F( Öm +) 习 ， 协 议 在 抗 消 息 损失 
方面 是 健壮 的 。( 必须 用 序列 号 区 别 过 时 的 响应 。) 


15.3.2 分 布 式 时 钟 同步 


本 方 给 出 了 Mahany and Schneider[MS85] 提 出 的 上 Byzantine- 健 壮 (对 于 r < N3) 分 布 式 时 
钟 -同步 算法 。Dolev、Halpern and Strong[DHS84] 证 明 ， 如 果 :> N/3， 如 果 不 用 鉴别 ， 是 不 可 
能 达到 间 步 。 

同步 算法 的 核心 是 一 个 协议 ， 这 个 协议 达到 时 钟 平均 值 的 不 精确 一 致 性 (inexact 
agreement)。 进 程 调整 它们 的 时 钟 ， 达 到 高 度 同 步 。 由 于 漂移 ， 不 入， 精度 就 会 降低 ， 在 经 
过 一 定 的 间隔 之 后 ， 需 要 新 一 轮 的 同步 。 假 设 在 实时 时 间 m， 时 钟 是 6- 同 步 的， 那么 直到 时 
间 im+R， 时 钟 是 〈6o +2pR)- 同 步 的 。 因 此 ， 如 果 期 望 精 度 为 8， 并 且 某 个 同步 轮 达 到 精度 6u， 
那么 每 (6-6o)/20 时 间 单 位 就 要 重复 轮 。 与 R 相 比 ， 执 行 一 次 同步 轮 的 时 间 3 通 常 是 非常 小 的 。 
因此 ， 在 同步 中 ， 可 以 忽略 漂移 ， 即 ， 时 钟 是 理想 的 ， 这 一 简化 的 假设 是 合理 的 。 

1. 不 精确 一 致 性 : 快速 收敛 算法 

在 由 Mahany 和 Schneider[MS85] 所 使 用 的 用 于 使 时 钟 同步 的 不 精确 一 致 性 问题 中 。 进程 p 
的 输入 值 为 实数 x,， 对 于 正确 进程 p 和 g，Ix,~x,l < 6. 进程 p 的 输出 为 实数 值 y,， 输 出 的 精度 定 
义 为 max, sly,-ysl。 算 法 的 目标 是 获得 很 小 的 精度 值 。 

Mahany 和 Schneider 提出 的 快速 收敛 算法 参见 图 15-6 所 示 的 算法 。 对 于 有 限 集合 4 CR， 
定义 两 个 函数 intv1 (A)= [min(A), max(A) ] 和 width( A)= max(4)-min(4)。 算 法 由 输入 收 
集 阶 段 和 计算 阶段 组 成 。 在 第 一 阶段 中 ， 进 程 p 请 求 其 他 每 个 进程 发 送 它 的 输入 (通过 向 所 有 
近邻 发 送 <ask> 消 息 )， 并 等 待 26% 时 间 单 位 。 在 这 个 时 间 过 后 ， 进程 p 已 经 收 到 所 有 正确 进程 
的 输入 ， 以 及 来 自 故障 进程 子 集 的 应 答 。 对 于 不 能 应 答 的 进程 ， 土 加 上 值 w (无 意义 )。 

然后 进程 对 接收 的 值 进行 过 滤 ， 这 确保 了 所 有 正确 进程 的 值 以 及 那些 与 正确 值 足够 接近 
的 错误 值 通过 。 当 正确 值 仅 差 6 时 ， 至 少 有 N-! 个 正确 值 ， 每 个 正确 值 至 少 有 N-! 个 值 ， 这 些 值 
与 它 至 多 相差 6。4, 存 储 具有 这 个 性 质 的 所 接收 的 值 。 

然后 ， 通 过 对 这 些 值 求 平均 值 来 计算 输出 ， 所 有 被 拒绝 的 值 用 一 个 估算 值 替代 ， 佑 算 值 
是 通过 将 确定 函数 esrimator 应 用 于 生存 下 来 的 值 计算 而 得 。 这 个 函数 满足 estimator(4) E 
intvi(4), 但 另外 也 可 以 是 任意 的 。 它 可 以 是 最 小 、 最 大 、 平均 或 者 (1/2)[max(4)+ min(4)]。 

定理 15.14 快速 收 化 算法 达到 精度 216/N， 

证 明 。 当 进程 p 超 时 ( 即 v,, 或 为 +, 或 为 2 )， 设 w 是 包含 在 多 中 的 进程 /的 值 。 当 进程 p 计 算 
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yp 时 《〈 即 ，ar 或 为 ww 或 为 estt ) ， 设 ar 是 包含 在 4 中 进程 的 值 。 把 判定 计算 求 和 分 成 两 部 分 ， 
一 部 分 为 正确 进程 (C) 上 的 求 和 ， 另 一 部 分 为 不 正确 进程 (B) 上 的 求 和 ， 就 可 以 对 精度 加 
以 限定 。 对 于 正确 进程 P 和 gq， 如 果 r EC, KP Hla, - ay 界限 为 0; 如 果 r E B， 这 个 差 la,, - 
aor| 界 限 为 26。 





(* Input, output, estimator of V *) 
: multiset of real ; 


var Lp, Yp, esttp : real; 
p: p 


begin (* Input collection phase *) 


forall q € P do send (ask) tog; 

wait 2émax ; (* Process (ask) and (val, z) messages *) 
while #V, < N do insert(V,, 00) ; 

(* Now compute acceptable values *) 

Ap := {2 € Vp: #{ye Vp: |ly—2z| <6} > N-t}; 

estip := = estimator(A,) ; 

while #A, < N do insert(Ap, estip) ; 

yp :二 (> A,)/ 


end 


Upon receipt of (ask) from q: 
send (val, zp) toq 


Upon receipt of (val, x) from q: 
if no such message was received from q before 
then insert(V,, x) 





图 15-6 快速 收敛 算法 

因为 如 果 p 和 r 是 正确 进程 ， 则 ab, = x,， 第 一 个 界限 由 此 而 得 。 确 实 ， 由 于 r 对 p 的 消息 
<ask> 迅 速 响应 ，v = x,。 类 似 地 ， 对 于 所 有 正确 进程 r'"，v,,. = x,.， 而 对 于 输入 的 假设 蕴含 着 ， 
Pp 过 滤 后 ，r 的 值 存活 下 来 ， 因 此 ap, = vpo 

第 二 个 界限 成 立 是 由 于 ， 对 于 正确 进程 p 和 gq ， 当 进程 p 和 g 计 算 它们 的 判定 时 ，width (A, 
UA,) 《26。 因 为 相 加 的 估算 值 位 于 可 接受 的 值 之 间 ， 因 此 只 需 分 别 考 虑 通过 p 和 g 过 滤 的 那些 
值 a, 和 as 之 间 的 最 大 差 就 足够 了 。 对 于 | w - a,1 < 56， 至 少 有 N - ! 个 进程 r， 而 对 于 | Var — a, | 
< ô, EDAN- (个 进程 r。 这 蕴含 着 存在 正确 进程 r， 满 足 l ww - a, lg 6 和 lw - a,1 <ô, 但 
因 * 是 正确 的 ，w = Vor, Fp! ap- a,l < 26, 

由 此 可 得 ， 对 于 正确 进程 p 和 9g，， 

ly, -34| = |2A,)/N - (2A, )/ N| 


WLR Bo) (Be 
Re- ge) (BeBe) 
agree) (gee) 














z1- =|- Z. z 


EG] < 2161N 
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( 少 于 三 分 之 一 ) 是 故障 进程 ， 这 个 精度 还 会 更 好 。 在 导出 这 个 精度 的 过 程 中 ， 可 以 将 ! 看 作 
故障 进程 的 实际 数 。 即 使 选择 合适 的 冰 数 estimator， 也 不 能 提高 算法 的 (最 坏 情 况 ) 输出 精 
度 。 事 实 上 ， 通 过 简单 地 将 这 个 值 发 送 给 pz，Byzantine 进 程 /可 以 使 p 取 av E inl (A,) 中 的 任 
何 值 。 如 果 知道 错误 进程 的 最 可 能 的 行为 ， 则 可 以 选择 合适 的 函数 ， 达 到 一 个 良好 的 平均 精 
度 。 

2. 时 钟 同步 

为 则 步 时 钟 ， 利 用 快速 收敛 算法 来 达到 对 时 钟 新 值 的 不 精确 的 一 致 性 。 假 设 初始 时 ， 时 
钟 是 56- 同步 的 。 必 须 修改 算法 ， 因 为 

(1) 由 于 不 能 确切 得 知 消息 延迟 时 间 ， 因 此 一 个 进程 不 知道 另 一 个 进程 的 精确 值 ， 且 

(2) 算法 执行 过 程 时 间 流 遂 ， 因 此 时 钟 没有 常数 值 ， 而 是 随时 间 增 加 。 

为 了 补偿 未 知 延迟 ， 进 程 对 接收 的 时 钟 值 增加 (1/2)( óna + Sain) (如 定理 15.12 的 确定 性 
协议 所 做 的 ) ， 在 输出 精度 中 引入 增 量 项 sss-5us。 为 了 把 接收 的 值 表 示 成 时 钟 值 ， 而 不 是 -- 
个 常数 ，p 将 接收 的 时 钟 值 (加 上 (1/2)( 5% + Sain) 与 它 自己 值 的 差 存 为 A,,。 在 时 间 t，p 对 
于 r 的 时 钟 的 近似 值 为 C, (1) + Aw。 修 改 的 算法 为 图 15-7 所 示 的 算法 。 


var Cp, Ap, estip : real; (* Clock, adaptation, estimator of V *) 
Dp, Ap : multiset of real ; 


begin (* Input collection phase *) 


Pp? ; 
forall q € P do send (ask) to q; 
wait 26max ; (* Process (ask) and (val, z} messages *) 
while #D, < N do insert(Dp, 00) ; 
(* Now compute acceptable values *) 
Ap := {x € Dp: #{y € Dp: |y — z| < 6 + (max — Smin)} >N-t}; 
estip := estimator (Ap) ; 
while #4, < N do insert( Ap, estip) ; 
Ap := (Sc Ap)/N ; 
Cp := Cp + âp 
end 


Upon receipt of (ask) from q: 
send (val, Cp) toq 


Upon receipt of { val, C ) from q: 
if no such message was received from q before 
then insert(Dp, (C + $ (max + 6min)) — Cp) 





图 15-7 时 钟 的 快速 收敛 算法 


图 15-7 所 示 的 算法 中 的 过 滤器 ， 与 图 15-6 所 示 的 算法 中 的 相 比 ， 有 更 广 的 界限 ， 即 6 + 
(6ma-6mn)， 而 在 图 15-6 所 示 的 算法 中 ， 这 个 界限 为 6。 更 广 的 界限 补偿 了 未 知 消息 的 延迟 ， 
并 由 以 下 命题 得 出 阔 值 。 设 do 表示 p 的 第 一 阶段 后 ， 插 入 到 D, 中 的 值 (与 上 一 个 算法 中 的 值 w 
相 上 比较 )。 


命题 15.15 对 于 正确 进程 p、g 和 /， 在 进程 超时 后 ,jd — da) <+ (Sna Omin) 成 立 。 
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证 明 。 从 g 到 p 的 消息 <val，C> 交 换 ， 实 现 了 定理 15.12 中 时 钟 读 取 的 确定 算法 。 当 进程 p 
接收 到 该 消息 时 ，IC, - [C + 1/2( Sax + Onin) ]l 界 限 为 《1/2)(6%ax - 6mm)， 因 此 dv 与 C, - CE 
多 相差 1/2( Smas + 6min)。 类 似 地 ，4d 与 C; - Cs 至 多 相差 (1/2)( 6wax + 6min)。 因 为 Cs 与 C, 至 多 相 
差 6， 因 此 结论 成 立 。 

定理 15.16 图 15-7 所 示 算 法 执行 后 ， 时 钟 是 同步 的 ， 且 精度 为 














2t 
ô -ô  )+ 一 [6+(6 -6.. 
( max min) + x! 十 人 max min )] 


证 明 。 在 证 明 中 ，C* 表 示 未 调整 的 时 钟 ，C。 表示 经 调整 的 时 钟 ， 即 C,，(1) = C(t) + 
为 了 限制 所 调整 时 钟 的 精度 ， 固 定 实时 时 间 :， 该 时 间 迟 于 所 有 正确 进程 的 超时 ， 并 设 w,, = C, 
+dpr。 由 命题 的 证 明 可 以 得 出 (对 于 正确 进程 p?、qg 和 r) Iwp- Cr (t) 1<1/2( Snax Omn) KA 
BBL Wor -ww 1< (Sma - 6min)。 对 于 不 正确 的 r-， 差 | wp -wy | 的 界限 为 26 +3( Snax Onin)» E 
的 证 明 类 似 于 定理 15.14 中 相应 步 的 证 明 。 

最 后 ， 由 于 Cp'(1) = C,(1) +A, =( Pr) /N， 如 同 定理 15.14 的 证 明 ， 将 平均 值 分 为 正 
确 进程 上 的 平均 值 与 不 正确 进程 上 的 平均 值 ， 则 可 导出 精度 。 口 

算法 描述 蕴含 所 有 消息 <vyal，C> 与 未 调整 的 时 钟 值 一 起 发 送 ， 要 做 到 这 一 点 可 以 通过 延 
迟 时 钟 调整 ， 直 到 向 所 有 <ask> 消 息 都 已 发 送 应 答 。 


15.3.3 轮 模型 的 实现 


可 用 具有 弱 同 步 假 设 的 系统 ， 模 拟 同步 计算 的 脉冲 模型 。 假 定 

(1) 假设 存在 消息 延迟 上 界 6o。 

(2) 在 一 个 脉冲 (状态 改变 的 时 间 加 上 发 送 消 息 的 时 间 ) 中 ， 局 部 计算 所 需 时 间 具 有 上 
Fy A 

(3) 在 每 个 时 钟 时 间 T， 进 程 的 时 钟 是 6- 同 步 的 ， 并 且 漂 移 为 p- 有 界 的 。 

每 个 脉冲 ， 模 拟 需 要 (1 + 0) (Snax + +y) 时 钟 时 间 。 

模拟 算法 非常 基本 ,假设 模拟 的 算法 在 时 钟 时 间 0 开 始 执行 (通过 向 所 有 时 钟 时 间 加 上 一 
个 固定 项 T。， 可 以 稍 后 开始 执行 算法 )。 当 进程 的 时 钟 读 到 0 时 ， 它 发 送 在 脉冲 1 的 消息 。 当 进 
程 的 时 钟 读 到 i( 1 +p)( 6m +6 + Y)， 进 程 执 行 脉冲 i 的 状态 变化 ， 并 随后 向 脉冲 (i +1) 发 送 
这 些 消息 。 当 时 钟 增加 到 任意 大 的 值 时 ， 用 这 个 策略 ， 每 个 正确 进程 执行 无 限 多 次 的 脉冲 。 

接 下 来 要 证 明 ， 在 正确 进程 p 执 行 那个 脉冲 的 状态 改变 之 前 ， 要 接收 在 脉冲 i 中 (由 正确 进 
程 ) 发 送 给 它 的 所 有 消息 。 假 设 进程 4 在 脉冲 ;向 p 发 送 消 息 。 进 程 4 在 它 的 时 钟 读 到 时 间 (i -1) 
(1+D)(6o+S+7y)， 即 ， 实 时 时 间 为 c[ (i-1)(1 + p)(5+6+7) ] 时 ， 开始 执行 前 一 个 
脉冲 的 状态 改变 ， 并 发 送 脉 种 的 消息 。 关 于 局 部 处 理 时 间 界 限 的 假设 ， 绕 含 着 脉冲 -i 的 消息 
最 述 在 实时 时 间 





cak- DU + Pn +6+7Y)]+Y 
HRX, RASE 〈 根 据 消 息 延迟 界限 ) 它 最 迟 在 实时 时 间 
calli- DO + PX ð max tO +Y +Y + Snax 
被 接收 。 进 程 p 在 局 部 时 钟 时 间 i(1 + p)( na +6 + 7) 开始 执行 状态 改变 ， 这 意味 着 实时 
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时 间 为 
cpli(l + P)6,., +64+7)) 
当 p 和 4 的 时 钟 在 时 钟 时 间 (i-1)(1 + p) pa +6+ y) 是 6. 同 步 时 ， 
c fi- DU + PX ma +O+Y) < 1G - DU Pima y) 
Pp 的 时 钟 漂移 是 p 有 界 的 ， 这 蕴含 着 
clid + POX ma + +y 2 c iG- DO +O ma +O ++ (On tO +7) 
组 合 这 些 方程 ， 可 得 
CLE + PMO ma +Ô +y] > c EG- DO Pô ma FOF YIFY + Spar 
这 编 含 着 p 在 执行 状态 改变 之 前 ， 接 收 消息 。 
习题 
15.1 节 
15.1 ABroadcast (N, t) 协议 (图 15-2 和 图 15-3 所 示 的 算法 ) 中 ， 交 换 了 多 少 条 消息 ? 
15.2 图 15-4 所 示 的 算法 中 执行 对 0 的 判定 中 ， 正 确 进程 发 送 的 最 大 消息 数 是 多 少 ” 针 对 
两 种 情况 做 出 回答 ， 一 种 情况 ， 将 军 是 正确 的 ; 另 一 种 情况 ， 将 军 是 有 故障 的 。 
15.2 节 


15.3 对 于 15.2.1 小 节 中 描述 的 Lamport、Shostak 和 Pease 广 播 算 法 ， 其 中 交换 了 多 少 条 消息 ? 

15.4 给 出 15.2.1 小 节 中 描述 的 Dolev 和 Strong 协 议 的 一 次 执行 ， 其 中 正确 进程 Pp 和 gq 以 
Wi# Ws 结束 。 

15.5 证 明 当 实现 交互 一 致 性 时 ， 可 以 解决 值 为 1 到 N 的 保 序 重 命名 问题 。 

15.6 假设 p 用 ElGamal 签 名 模式 (15.2.3 小 节 )， 使 用 同一 个 值 4， 对 消息 M1 和 M, 签 名 。 
说 明 如 何 从 这 两 个 签 过 名 的 消息 ， 找 出 已 的 密 铀 。 

15.7 ” 设 " 是 两 个 大 素数 的 乘积 ， 并 假设 给 定 计算 平方 根 的 黑金 子 。 即 ， 给 定 二 次 剩余 y， 
MEFS kx, B=y (方程 模 n)。 证 明 如 何 用 金子 进行 对 hn 的 因子 分 解 。 


15.3 节 


15.8 证明 如 果 时 钟 Co 和 C% 的 漂移 是 DO- 有 界 的 ， 且 在 实时 时 间 ! 是 6- 同 步 的 ， 那 么 在 时 钟 
时 间 7= C, (1)， 它 们 是 6(1 +p)- 同 步 的 。 

15.9 ”如 果 多 条 消息 的 延迟 接近 Gin，( 即 ， 划 至 对 于 很 小 的 E， 书 (6m + €) 也 会 从 0 快速 
地 离开 ) 那么 概率 时 钟 同步 协议 是 有 效 的 。 

如 果 多 条 消息 的 延迟 接近 6 (FP, BEM FAR MC, Fôn- e) 也 会 离 ] 足 够 远 )， 给 
出 一 个 能 有 效 工作 的 “双重 ”协议 。 证 明 期 望 的 消息 复杂 度 为 2 . [1 -Fl Sna E) ]“， 并 证 
明 期 望 的 运行 时 间 界 。 

15.10 对 于 所 有 正确 进程 p， 图 15-6 所 示 的 算法 中 的 集合 A 满足 width (A,) < 6 吗 ? 





第 16 章 故障 检测 


在 异步 系统 中 (14.1 节 )， 一 致 性 问题 是 不 可 解 的 ， 这 导致 了 对 问题 的 更 弱 表 述 和 更 强 模 
型 。 前 者 的 例子 有 弱 协 同和 随机 化 ， 后 者 的 例子 包括 引入 同步 。 现 在 普遍 认为 故障 检测 器 是 
增强 计算 模型 的 可 选 方法 之 一 。 

大 多 数 分 布 式 编程 环境 确实 以 某 种 方式 提供 时 钟 和 计时 器 ， 这 实际 上 引发 了 对 同步 模型 
的 研究 。 理 论 研究 揭示 了 什么 任务 需要 利用 这 些 原 语 ， 必 须 用 到 什么 程度 。 有 了 故障 检测 器 ， 
情况 是 类 似 的 : 一 旦 企图 与 损毁 进程 通信 ， 运 行 时 间 支 持 系统 常常 会 返回 错误 消息 。 然 而 ， 
这 些 错 误 消息 并 不 总 是 绝对 可 靠 。 因 此 研究 它们 必须 多 么 可 靠 ， 才 能 解决 一 致 性 问题 (或 者 
其 他 问题 )， 是 非常 有 用 的 。 

与 同步 〈 利 用 物理 时 钟 实现 ) 形成 对 照 ， 故 障 检测 器 没有 直截了当 的 直观 实现 。 这 表明 
必须 找到 非 平 凡 解 ， 以 便 在 运行 系统 中 实现 它们 或 者 将 其 作为 应 用 程序 中 的 模块 。 实 现 它们 
时 党 依赖 使 用 计时 器 (参见 16.4 节 )。 这 已 经 导致 故障 检测 器 方法 受到 一 些 严厉 批评 。 并 认为 
这 样 的 “故障 检测 器 ”并 不 解决 任何 问题 ， 因 为 实现 它们 所 要 求 的 资源 (时间)， 完 全 可 被 用 
来 直接 求解 一 致 性 问题 。 

可 以 肯定 的 一 点 是 ， 过 去 半 个 世纪 里 ， 同 样 具有 争议 的 结果 实际 上 已 应 用 到 计算 机 科学 
中 的 每 一 项 发 明 。 如 果 程 序 必 须 被 编译 成 机 器 语言 才能 执行 ， 为 什么 还 要 用 高 级 编程 语言 ? 
我 们 何不 直接 用 机 器 语言 书写 整个 程序 ! 为 什么 要 利用 设备 驱动 程序 从 应 用 程序 中 访问 磁盘 
和 打印 机 ， 如 果 这 些 驱动 程序 本 身 仅仅 是 程序 而 已 ? 我 们 何不 将 驱动 程序 的 代码 写 入 应 用 程 
序 中 ? 这 样 没有 驱动 程序 也 能 运行 。 当 然 ， 我 们 知道 ， 利 用 高 级 语言 和 驱动 程序 的 理由 是 : 
它们 使 得 编程 更 简单 ， 更 易于 理解 和 可 移植 ， 并 且 提 高 了 研究 某 些 概念 的 能 力 。 我 们 也 将 这 
些 理由 用 在 故障 检测 中 。 


16.1 模型 和 定义 


故障 检测 很 入 以 前 就 被 应 用 于 许多 实际 系统 ， 并 在 大 约 1991 年 ， 首 先 由 Cornell 大 学 Sam 
Toueg 研 究 组 表述 为 一 种 抽象 机 制 。 他 们 花 了 约 5 年 时 间 ， 形 成 一 篇 基础 性 的 论文 并 发 表 于 
[CT96] ， 我 们 的 大 部 分 定义 和 结果 均 由 此 而 来 。 

故障 检测 器 是 一 种 模块 ， 它 为 每 个 进程 提供 一 种 可 疑 (suspected) 进程 集 。 如 果 进 程 /在 
求 值 时 刻 受 到 怀疑 ， 则 程序 中 的 测试 E DIRE. ARPS BARK. KE 
进程 中 的 模块 无 须 一 致 ( 即 ， 正 确 进 程 p 可 能 怀疑 "， 而 正确 进程 4 不 怀疑 )， 在 任何 时 刻 ， 进 
程 也 不 必 是 公平 的 〔( 即 ， 正 确 进程 p 可 能 怀疑 正确 进程 >， 也 可 能 不 怀疑 故障 进程 r)。 当 然 ， 
为 了 能 够 用 故障 检测 器 推理 程序 ， 我 们 首先 必须 表达 检测 器 的 性 质 ， 特 别 值得 注意 的 是 检测 
器 输出 和 实际 故障 之 间 的 关系 。 

我 们 首先 定义 故障 模式 (failure pattern) 来 表示 实际 故障 。 为 了 避免 使 用 时 序 软 辑 表 达 
式 ， 在 我 们 的 表达 式 中 ， 采 用 明确 的 时 间 变 量 :。 这 个 时 间 变 量 ! 的 值 域 为 所 有 时 间 实 例 的 集合 
T， 例 如 ， 可 以 是 自然 数 集 。 请 注意 ， 进 程 不 知道 时 间 :、 故 障 模式 F、 损 筑 进程 集合 Crash (下 ) 





316 SAD EF 8 





AUER RA Corr (F), Ram AE! 当 进 程 4 在 时 刻 t 访 问 它 的 故障 检测 器 时 ， 
仅 能 “看 见 ” 值 #H(g, t). 


16.1.1 四 种 基本 检测 器 类 型 


执行 中 出 现 的 损毁 可 用 故障 模式 模型 化 ， 它 是 一 个 国 数 F 了 一 PCP). KM, F(t) 是 在 
时 刻 : 损 裔 的 进程 的 集合 ， 因 为 我 们 假设 不 能 重新 开始 ，t， < 41 蕴含 着 F(11) EF). HCrash 
(F) = Uier F(t) 和 Corr(F) =P \Crash(F) 分 别 表示 损毁 进程 集合 和 正确 进程 集合 。 

怀疑 因 时 间 和 进程 的 不 同 而 有 所 差异 。 用 函数 H: Px T -> P(P) 模 型 化 。 这 里 H(g, t) 
是 4 在 时 刻 ! 怀 疑 的 进程 的 集合 。 

为 使 故障 检测 器 成 为 非 确定 性 的 ( 即 ， 已 知 一 种 故障 模式 ， 可 能 产生 不 同 响应 )，、 我 们 将 
检测 器 D 模型 化 为 一 种 映射 ， 将 故障 模式 映射 到 故障 检测 器 历史 的 集合 。 即 ， 对 于 故障 模式 
F, RHE D(F) 是 故障 检测 器 的 历史 。 

历史 性 质 

可 以 理解 的 是 ， 为 使 故障 检测 器 可 用 ， 在 它 的 输出 (故障 检测 器 历史 ) 与 输入 (故障 模 
式 ) 之 间 必 定 存在 一 种 关系 。 要 求 总 是 具有 两 种 类 型 ， 即 完全 性 (检测 器 将 怀疑 损毁 进程 ) 
和 精确 性 (检测 器 将 不 怀疑 正确 进程 )。 完 全 性 限制 了 受到 怀疑 的 进程 集合 的 下 界 ， 精 确 性 限 
制 了 受到 怀疑 的 进程 集合 的 上 界 ， 但 是 ， 两 种 情形 中 的 任何 一 种 都 不 能 精确 匹配 所 要 求 的 损 
RERE (实际 构想 的 系统 永远 不 会 满足 这 样 的 要 求 )。 

我 们 只 考虑 一 种 形式 完全 性 。 

定义 16.1 如 果 每 个 损毁 进程 最 终 受 到 各 正确 进程 的 怀疑 ， 则 称 故 障 检 测 器 DD 是 完全 的 : 

VF :WHE D(F): Xt: Vp GCrash(F): Nq €Corr(F): Yt > t: pEH(q,t') 


(在 文献 中 ， 这 个 性 质 也 称 为 强 完 全 性 。) 

我 们 考虑 四 种 不 同形 式 的 精确 性 。 记 住 精确 性 规定 ， 正 确 进程 是 不 受 怀疑 的 。 在 强 完全 
性 形式 中 ， 上 述 规定 对 所 有 正确 进程 成 立 ; 在 弱 完 全 性 形式 中 ， 上 述 规定 至 少 对 一 个 正确 进 
程 成 立 。 对 于 “最 终 ” 形 式 ， 上 述 规定 不 需要 一 开始 就 成 立 ， 而 是 从 某 时 刻 起 成 立 。 

定义 16.2 ”如 果 进 程 没有 损毁 ， 也 没有 进程 曾经 受到 怀疑 ， 则 称 故障 检测 器 刀 是 强 精确 
的 (strongly accurate ) : 

VF:WHED (F): Wt: Yp q F(t): p €H(q,t) 
如 果 存 在 一 个 正确 进程 从 未 受到 怀疑 ， 则 称 故 障 检测 器 DD 是 弱 精 确 的 (weakly accurate): 
VF:YHED (F): 3p €Corr(F): Yt: Yq EFH): pE€H(q,t) 


如 果 存 在 一 个 时 刻 ， 其 后 ， 没 有 正确 进程 受到 怀疑 ， 则 称 故 障 检测 器 刀 是 最 终 强 精确 的 


(eventually strongly accurate ): 
VF:WHE D(F):3t:Wt' > t:Vp,g €Corr(F): p €H(q,t') 


如 果 存 在 一 个 时 刻 ， 其 后 ， 有 一 个 正确 进程 不 受 怀疑 ， 则 称 故障 检测 器 DD 是 最 终 弹 精确 
的 (eventually weakly accurate ): 


VF WHE D(F): Jt: 4p €Corr(F): Vt' > t: Yq €Corr(F): p €H(q,t’) 
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可 知 ， 定 义 仅 仅 限 制 非 损毁 进程 g 的 怀疑 。 与 损毁 进程 的 怀疑 无 关 。 进 而 ， 强 精确 性 定义 
明确 地 排除 了 损毁 进程 在 损毁 之 前 受到 怀疑 。 对 于 其 他 三 种 形式 的 精确 性 ， 不 包含 这 一 点 也 
没有 任何 关系 。 

非常 容易 获得 一 个 完全 的 (检测 器 怀疑 每 个 进程 Hq, t) =P) 故障 检测 器 ， 同 时 ， 也 
非常 容易 得 到 一 个 精确 的 (检测 器 不 怀疑 任何 进程 Hla, t) =O) 故障 检测 器 。 有 趣 又 有 
用 的 检测 器 总 是 把 完全 性 和 精确 性 结合 起 来 。 下 面 考虑 四 种 类 型 。 

定义 16.3 。 如 果 故 障 检测 器 是 完全 且 强 精确 的 ， 则 称 它 是 完美 的 (perfect) ; APAT 
理想 检测 器 类 。 

如 果 故 障 检测 器 是 完全 且 弱 精确 的 ， 则 称 它 是 强 的 (strong); 用 S 表示 强 检 测 器 类 。 

如 果 故 障 检测 器 是 完全 且 最 终 强 精确 的 ， 则 称 它 是 最 终 完美 的 (eventually perfect) ; 用 
0 表示 最 终 理想 检测 器 类 。 

如 果 故 障 检测 器 是 完全 且 最 终 弱 精确 的 ， 则 称 它 是 最 终 强 的 (eventually strong) ; MOS 
表示 最 终 强 检测 器 类 。 


16.1.2 故障 检测 器 的 用 途 和 缺陷 


不 难 想象 在 设计 分 布 式 应 用 程序 时 如 何 使 用 故障 检测 器 。 

回忆 一 下 我 们 在 异步 分 布 式 算法 (第 14 章 ) 中 经 常 遇 到 的 通信 操作 : 

(1) 每 个 节点 进行 一 次 向 所 有 近邻 发 送 消息 (shout) 的 操作 ， 即 ， 向 每 个 节点 发 送 一 条 消息 。 

(2) 每 个 节点 收集 所 发 出 的 N - :条 消息 。 

进程 永远 不 会 等 待 多 于 N - ! 条 消息 的 到 达 ， 因 为 在 损毁 情况 下 ， 这 样 做 会 有 死 锁 的 风险 。 
构造 不 会 引起 永久 阻塞 (参见 引 理 14.30)， 因 为 至 少 N - ! 个 进程 是 活 的 。 缺 陷 是 即使 没有 损 
毁 ， 收 集 的 消息 集 也 由 于 进程 的 不 同 而 不 同 。 收 集 的 消息 集 大 小 总 是 为 (N - 站)。 如 果 没 有 检 
测 器 ， 绝 对 禁止 等 待 来 自 某 个 特定 进程 的 消息 的 到 达 ， 因 为 如 果 希 望 的 某 个 发 送 进程 已 经 损 
毁 ， 它 可 能 导致 阻塞 

利用 故障 检测 器 进行 通信 的 标准 方式 是 : 

(1) 每 个 节点 向 各 节点 发 送 一 条 消息 。 

(2) 对 于 每 个 进程 5， 每 个 节点 等 待 ， 直 到 来 自 4 的 消息 到 达 ， 或 者 4 受到 怀疑 

故障 检测 器 的 完全 性 使 得 这 种 构造 免 于 永久 阻塞 。 事 实 上 ， 由 于 已 经 损毁 ， 不 发 送 消息 
的 每 个 进程 最 终 受到 怀疑 。 正 如 前 面 的 构造 ， 这 样 做 有 一 个 缺陷 : 存在 各 种 情况 ， 会 导致 由 
不 同 正确 进程 收集 的 消息 所 组 成 的 不 同 集合 。 

(1) 进程 9 损毁 ， 但 是 在 它 损毁 之 前 ， 发 送 了 部 分 或 者 全 部 所 请 求 的 消息 。 进 程 P, 在 怀疑 
9 之前， 接收 这 些 消息 ， 而 进程 pz 没有 接收 到 这 些 消息 ， 在 结束 它 的 接收 阶段 时 没有 4g 的 消息 。 

(2) 进程 q 是 正确 的 ,并 且 发 送 消息 。 但 是 进程 p, 怀 疑 g9， 且 未 收集 9 的 消息 。 而 p; 不 怀疑 4， 
并 且 收 集 q 的 消息 。 

因此 ， 所 收集 的 消息 的 集合 ， 可 能 包括 来 自 损毁 进程 的 消息 ， 以 及 正确 进程 错过 的 消息 。 
集合 大 小 可 能 不 同 ， 即 使 损毁 数 存在 界 !， 由 于 错误 的 怀 蜂 收集 的 消息 数 也 可 能 少 于 N-t。 
只 有 限制 受到 怀疑 的 进程 数 ， 才 能 保证 这 个 集合 中 消息 数 的 下 界 。 这 主要 是 通过 弱 精 确 检测 
器 完成 的 。 

有 了 故障 检测 器 ， 就 有 可 能 接收 来 自 特别 提 到 过 的 进程 的 消息 ， 当 产生 对 进程 的 怀疑 时 ， 





wn 
Q 
O 


318 第 三 部 分 È # 








就 会 中 断 对 这 个 消息 的 等 待 。 由 此 可 见 ， 用 这 种 方法 ， 从 一 个 正确 进程 到 另 一 个 正确 进程 的 
消息 也 可 能 不 能 被 楼 收 。 

所 勾画 出 的 消息 接收 模式 是 如 此 普通 ， 以 至 于 我 们 为 其 引入 编程 简写 方式 : 语句 “collect 
<message, par> from q”。 指 令 等 待 ， 直 到 接收 q 的 消息 <message，par>， 或 者 q 受 到 怀疑 。 
返回 表明 接收 成 功 的 布尔 值 。 





Ti := input ; 
for r:=1to N 
do begin if i=r 
then forall j do send (value, z;,r) to j ; 


if collect (value, z’,r) from p, 
i 





decide x; 


图 16-1 旋转 协调 器 算法 、 利 用 强 故 障 检测 器 S (对 于 p;) 


16.2 用 弱 精 确 检 测 器 解 一 致 性 问题 


本 节 给 出 一 种 利用 故障 检测 器 的 相对 简单 的 一 致 算法 。 正 确 性 规范 是 : 

(1) 终止 性 每 个 正确 进程 判定 一 次 。 

(2) 一 致 性 所 有 判定 (在 一 次 执行 中 ) 是 相同 的 。 

(3) 有 效 性 ”一 个 判定 至 少 等 于 一 个 进程 的 输入 。 

易 证 明 ， 有 效 性 理 含 着 非 -平凡 性 。 因 此 ,证 明 ， 如 果 没 有 故障 检测 我 们 会 得 到 一 个 不 可 
能 的 结果 。( 定理 14.8) 

在 图 16-1 所 示 的 算法 中 ， 利 用 弱 精 确 故 障 检测 器 解决 了 这 个 问题 。 存 在 一 个 进程 ， 从 未 
受到 怀疑 ， 但 是 进程 却 不 知道 是 哪 一 个 进程 ! 只 有 当 某 些 进程 收集 了 这 个 未 知 进程 的 一 条 消 
息 后 ， 才 能 保证 它们 全 部 接收 这 条 消息 ， 因 此 ， 也 才能 保证 它们 全 部 接收 相同 信息 。 在 算法 
中 ， 通 过 给 每 个 进程 一 个 机 会 ， 避 免 由 于 不 知道 哪个 节点 未 受 怀疑 所 引发 的 困难 。 称 这 种 方 
法 为 旋转 协调 器 (rotating coordinator) 模式 。 算 法 由 N 轮 循环 组 成 ， 每 个 进程 与 它们 中 的 一 
个 进程 协调 。 

， 我们 称 进程 为 p, 到 pw， 且 pj 协调 第 / 轮 。 在 一 轮 中 ， 协 调 器 向 所 有 近邻 发 送 它 的 值 ， 所 有 节 
点 收集 这 个 协调 器 的 消息 。 如 果 某 个 节点 成 功 ， 则 用 从 协调 器 接收 的 值 替代 它 的 值 。 在 此 只 
对 正确 性 证 明 进 行 概述 ， 因 为 详细 情况 是 相当 明显 的 。 

定理 16.4 图 16-1 所 示 的 算法 求解 一 致 性 问题 ， 

证 明 。 因 为 在 一 轮 中 ,没有 一 个 正确 进程 永远 受到 阻塞 ， 算 法 满足 终止 性 。 协 调 器 是 正 
确 的 ， 并 且 发 送 消息 ,或 者 最 终 受 到 怀疑 ( 由 于 检测 器 的 完全 性 )。 我 们 可 以 对 ;用 归纳 法 证 
明 ， 每 个 正确 进程 可 达 第 ;i 轮 循环 。 

因为 进程 只 能 保存 它 的 值 ， 或 者 用 接收 协调 器 的 值 来 替代 它 , .有效 性 得 到 满足 ， 这 使 我 
们 可 以 证 明 〈 再 次 用 归纳 法 )， 各 进程 进入 每 一 轮 时 ， 带 有 一 个 值 ， 该 值 是 某 些 进程 输入 。 

为 了 证 明 一 致 性 ， 设 pj 是 从 不 受到 怀疑 的 进程 。 在 第 j 轮 中 ， 每 个 进程 (完成 该 轮 循环 的 执 
行 ) 接收 来 自 P 的 值 ， 因 此 ， 所 有 进程 完成 / 轮 时 ， 具 有 相同 值 。 以 一 个 值 进 入 那 轮 ， 完成 时 
也 要 有 一 个 值 (相同 的 )， 这 理 含 着 ， 整 个 算法 完成 时 ， 确 实 只 有 同一 个 值 。 口 
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观察 可 知 ， 在 程序 中 ， 并 没有 出 现 弹性 :。 实 际 上 ， 弹 性 为 N-1。 如 果 弹 性 受到 限制 ， 目 
前 还 不 知道 如 何 减 少 轮 数 。 原 因 是 正确 协调 器 可 能 受到 怀疑 。 在 本 算法 中 ， 如 果 进 程 是 正确 
的 ， 并 没有 多 大 的 帮助 ， 所 需要 的 是 它们 不 受 怀疑 。 如 果 增 强 检测 器 的 精确 度 ， 可 以 减少 的 
轮 数 。 参 见习 题 16.5。 


16.3 最 终 弱 精确 检测 器 


在 前 一 节 中 ， 对 弱 精 确 性 所 做 的 假设 ， 理 含 着 在 算法 的 前 N 轮 中 ， 存 在 一 轮 具 有 不 受 怀 
疑 的 协调 器 。 因 此 ， 可 以 设计 算法 在 N 轮 后 终止 。 然 而 ， 最 终 弱 精确 性 ， 尽 管 绚 含 在 将 来 某 
一 时 刻 ， 会 出 现 一 轮 ， 其 中 有 不 受 怀疑 的 协调 器 ， 但 它 并 未 提供 关于 这 是 那 一 轮 的 一 个 界定 

因此 ， 除 了 实际 上 所 达到 的 一 致 性 ， 解 中 还 必须 检测 (detect) 何 时 达到 一 致 性 。 除 了 故 
障 检测 器 之 外 ， 这 个 检测 要 求 ， 存 在 界限 为 : < N/2 的 弹性 。 这 个 结果 将 在 16.3.1 小 节 证 明 。 我 
们 在 16.3.2 布 提出 的 算法 并 设 有 提供 最 优 弹 性 ， 而 是 假设 弹性 为 : < N/3。 


16.3.1 弹性 上 界 


在 任意 长 (但 有 限 ) 的 初始 阶段 ， 具 有 景 终 精 确 性 质 的 故障 检测 器 可 能 展示 任意 的 行为 。 
这 意味 着 在 防止 有 限 次 错误 执行 方面 ， 它 们 是 无 用 的 。 按 照 不 可 能 性 的 证 明 : 通过 构造 有 限 
次 错误 执行 所 得 的 结果 ， 可 以 继续 应 用 到 最 终 精 确 故 障 检测 器 的 模型 上 。 例 如 ， 定 理 14.16 就 
是 这 种 情形 。 这 里 ， 我 们 将 定理 扩展 到 具有 故障 检测 的 模型 上 。 定 理 是 为 最 终 完 美 检测 器 而 
制定 的 。 其 结果 对 最 终 强 检测 器 也 成 立 ， 因 为 这 类 检测 器 满足 弱 规 范 。 

定理 16.5 不 存在 使 用 允许 1 > NM/2 次 损毁 的 0 刀 的 一 致 算法 。 

证 明 。 反 证 法 。 假 设 存 在 这 样 的 算法 。 在 P 中 ， 可 以 构成 两 个 大 小 都 为 N- 的 不 相交 进程 
集 S 和 T。 考 虑 两 种 情形 。 

(1) 在 情形 0 中 ，$ 中 的 进程 输入 都 为 0， 那 些 在 8 外 面 的 进程 立刻 发 生 故 障 ， 这 种 情形 一 
开始 ， 就 被 $ 中 的 所 有 进程 检测 到 。 因 为 8 中 包含 W-! 个 进程 ，$ 中 的 进程 在 有 限时 间 内 判定 。 
又 由 于 所 有 活动 进程 输入 为 0， 因 而 它们 的 判定 为 0。 

(2) 在 情形 1 中 ，7 中 的 进程 输入 都 为 1， 那 些 在 7 外 面 的 进程 立即 发 生 故 障 ， 这 种 情形 一 
开始 ， 就 被 7 中 的 所 有 进程 检测 到 。 因 为 7 中 包含 W-t 个 进程 ，7 中 的 进程 在 有 限时 间 内 判定 。 
又 由 于 所 有 活动 进程 输入 为 1， 因 而 它们 的 判定 为 1。 

由 两 种 情形 可 知 ， 故 障 检测 器 的 行为 与 对 9$PP 的 要 求 一 致 。 我 们 并 没有 详 述 ， 在 情形 0 
(或 情形 1) 中 为 什么 对 0 (或 1) 的 判定 是 不 可 避免 的 。 

因为 S 和 7 是 不 相交 的 ， 可 以 将 这 两 种 情形 组 合成 一 种 新 的 情形 ， 称 它 为 情形 2。 假 设 只 有 
SUT7 外面 的 进程 发 生 故 障 ，$ 中 的 进程 输入 都 为 0，7 中 的 进程 输入 都 为 1。SU7 外 面 的 进程 故 
障 很 快 地 被 那些 S 和 7 中 的 进程 检测 出 。 而 且 ，5 中 的 进程 从 一 开始 就 错误 地 怀疑 那些 T 中 的 进 
程 ， 而 7 中 的 进程 从 一 开始 就 错误 地 怀疑 那些 8 中 的 进程 。 最 终 完美 性 要 求 使 得 这 种 情形 持续 
任意 有 限 的 时 间 。 从 $ 到 7 所 发 送 的 消息 传输 非常 慢 ， 反 之 亦 然 。 

对 于 S$ 中 的 进程 情形 2 就 如 同情 形 0， 而 对 于 7 中 的 进程 情形 2 就 像 情形 1， 因 此 这 些 进 程 开 
始 执 行 一 系列 相同 步 。 在 有 限 (finite time) 的 时 间 内 ， 这 些 进 程 对 同一 个 值 判定 ， 就 如 同 之 
前 所 述 的 情形 ， 即 ，$ 和 7 中 的 进程 对 0 和 1 判定 。 在 每 组 中 至 少 发 生 一 次 判定 之 后 ， 错 误 的 怀 
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疑 停止 ， 从 $ 向 7 发 送 的 消息 到 达 ， 反 之 亦 然 。 
因此 我 们 构造 一 种 情形 ， 其 中 故障 进程 数 少 于 ! 个 。 故 障 检 而 器 按照 最 终 完美 性 的 定义 来 
运行 ， 从 正确 进程 到 正确 进程 的 所 有 消息 都 到 达 。 然 而 ， 不 同 进 程 进行 不 同 的 判定 ， 这 表明 
一 致 性 得 不 到 满足 。 
一 致 性 根本 不 可 能 性 的 证 明 (定理 14.8)， 构 造 了 一 个 无 限 不 判定 执行 在 下 一 节 将 会 看 
到 ， 通 过 最 终 正确 检测 器 可 以 避免 这 种 无 限行 为 。 


16.3.2 一致 算法 


图 16-1 所 示 的 算法 从 一 开始 就 假设 故障 检测 器 是 弱 精 确 的 。 这 蕴含 着 ， 存 在 不 受 怀 疑 的 
协调 器 ， 因 此 在 前 N 轮 的 循环 内 ， 达 到 了 值 的 一 致 性 。 在 图 16-2 所 示 的 算法 中 ， 协 调 器 必须 扩 
展 它 的 活动 ， 来 发 现 是 否 一 致 性 已 经 出 现 。 它 首先 收集 所 有 进程 的 当前 值 ， 并 检查 它们 是 否 
是 一 致 的 《参见 步骤 2)。 这 里 有 一 个 缺陷 ， 因 为 由 于 错误 的 怀疑 ， 协 调 器 可 能 只 有 效 地 收集 
不 到 一 半 的 活动 值 ， 然 后 就 宣布 一 个 值 作为 最 终结 果 ， 而 该 结果 实际 上 只 得 到 少数 进程 的 支 
持 。 这 里 ， 利 用 对 故障 进程 数 所 做 的 限制 : 在 收集 阶段 中 ， 协 调 器 并 不 使 用 它 的 检测 器 ， 而 
是 像 在 经 典 方法 中 那样 , 等待 -! 个 进程 的 投票 。 图 16-2 所 示 的 算法 的 健壮 性 被 限定 为 < N/3。 
现在 ， 协 调 器 所 观测 到 的 一 致 性 至 少 蕴 含 着 ， 绝 大 多 数 进程 已 经 计算 这 个 值 ， 不 必 所 有 正确 
进程 都 这 样 做 ， 由 于 协调 器 仅仅 等 待 固定 的 票数 ， 有 些 不 一 致 的 投票 可 能 漏 掉 。 

如 果 协 调 器 宣布 ， 它 从 一 致 的 投票 中 选择 值 v"， 正 如 在 宣布 第 r 轮 结果 的 消息 <outecome，d， 
v，7> 中 位 d 所 表明 的 那样 ， 则 允许 判定 。 判 定之 后 ， 进 程 继 续 它 们 的 活动 ， 并 帮助 其 他 进程 
进行 判定 。 

引 理 16.6 对 于 每 轮 循环 r 和 正确 进程 ps，p 完 成 第 r 轮 执行 。 

证 明 。 假 设 所 有 正确 进程 开始 执行 第 r 轮 。 正 确 协调 器 将 完成 步骤 1， 这 是 因为 发 送 了 足够 多 
的 投票 。 正 确 进 程 将 完成 步 又 3， 因 为 如 果 它 是 正确 的 ,协调 器 将 发 送 消息 ; 如 果 它 不 是 正确 的 ， 
最 终 将 会 受到 怀疑 。 因 此 所 有 正确 进程 完成 整个 一 轮 的 循环 。 可 用 归纳 法 完成 整个 证 明 。 口 

我 们 现在 证 明 大 到 足以 导致 判定 的 绝对 多 数 是 不 变 的 。 

引 理 16.7 如 果 在 第 k>N - ! 轮 开始 ， 进 程 有 值 v， 那 么 在 该 论 的 结束 ， 至 少 有 K 个 进程 有 
tiv. 

证 明 。 进 程 可 以 怀疑 协调 器 ， 并 保持 同一 个 值 。 改 变 值 的 惟一 方法 是 接收 具有 该 值 的 协 
调 器 的 消息 。 协 调 器 取出 所 接收 的 N-t 个 值 中 的 大 多 数 。 至 多 有 1! 个 进程 的 值 不 同 于 v， 因 此 ， 
至 少 接收 N- 21 张 对 v 的 投票 ， 且 N- 2! > 1。 这 表明 如 果 协 调 器 在 步骤 2 发 送 一 值 ， 它 发 送 了 值 ， 
并 且 具 有 值 v 的 进程 数 只 能 增加 ， 不 会 下 降 。 口 

引 理 16.8 每 个 正确 进程 进行 判定 。 

证 明 。 最 终 精 确 性 蕴含 着 ， 最 终 存在 某 一 轮 r"， 它 的 协调 器 c 在 第 r 轮 或 者 其 后 轮 中 不 受 
怀疑 。 在 那 一 轮 中 ， 所 有 正确 进程 接收 协调 器 的 消息 ， 并 对 同一 个 值 达 成 一 致意 见 ， 并 继续 
这 样 做 ( 引 理 16.7)。 因 而 , Bree, 协调 器 所 发 送 的 侈 部 消息 ,宣布 v 是 一 致 的 (d = true), 
因此 只 要 进程 在 步骤 3 中 收集 一 条 消息 ， 就 开始 对 v 进 行 判定 。 但 c 不 再 受到 怀疑 ， 在 第 r + N 
轮 中 ， 再 次 成 为 协调 器 ， 于 是 在 该 轮 结束 时 ， 所 有 进程 已 经 进行 判定 。 口 

定理 16.9 图 16-2 所 示 的 算法 是 具有 (0 5 的 一 致 算法 。 
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证 明 。 对 r 用 归纳 法 相当 容易 证 明 (证 明 留 给 读者 ) ， 如 果 进 程 持 有 第 7 轮 中 的 一 个 值 ， 这 
个 值 在 输入 中 。 这 就 证 明了 有 效 性 。 引 理 16.7 列 含 着 一 致 性 ， 因 为 从 一 个 判定 轮 可 知 ， 对 其 
他 值 的 判定 不 存在 足够 的 支持 。 最 后 ， 在 前 述 的 引 理 中 表达 了 终止 性 。 














; :二 input ; 
r:=0; 
while true do 
begin (* Start new round and compute coordinator*) 
r:=r+i1;c:=(rmodN)+1; 
(* Phase 1: all processes send value to coordinator *) 
send (value, z;,r ) to pe ; 
(* Phase 2: coordinator evaluates outcome *) 
if i = c then 
begin wait until N — t mesgs. (value, v;,r) have been received; 
v := majority of received values; 
d:= (Vj: vu; =v); (* range over received messages *) 
forall j do send (outcome, d,v,r) to p; 
end ; 
(* Phase 3: evaluate the round *) 
if collect (outcome, d,v,r) from pe then 
begin x; := v ; 
if (dA (y; = Q)) 
then decide(v) 
end 





图 16-2 利用 % S 的 旋转 协调 器 算法 


16.4 故障 检测 器 的 实现 


故障 检测 器 方法 的 明确 优势 是 ， 只 须 处 理 检 测 器 的 性 质 ， 而 不 管 它 如 何 实现 。 然 而 ， 我 
们 要 给 出 一 些 可 能 的 实现 ， 来 证 明 其 后 发 生 了 什么 ， 同 时 也 是 对 定义 的 一 种 说 明 。 在 大 多 数 
情况 下 ， 使 用 定时 器 后 ， 检 测 器 只 是 异步 接口 的 一 种 形式 。 


16.4.1 同步 系统 : 完美 检测 


完美 故障 检测 图 16-3 所 示 的 算法 假设 通信 延迟 具有 上 界 4。 活 动 进程 以 时 间 间 隔 o 发 送 消 
息 <alive> ， 如 果 在 c+ /时 间 还 未 接收 到 一 个 进程 的 消息 ， 表 明 进 程 已 经 损毁 。. 


16.4.2 部 分 同步 系统 : 最 终 完美 检测 


如 采 消 息 延迟 上 界 未 知 ， 或 者 由 于 某 种 原因 ， 不 愿 将 其 包括 在 程序 中 (例如 ， 因 为 可 移 
植 性 )。 具 有 稍微 弱 性 质 的 检测 器 也 是 可 能 的 。 检 测 器 (图 16-4 所 示 的 算法 ) 从 一 个 较 小 的 估 
算 值 4 开始。 也 可 能 发 生 早 停 ， 如 ， 进 程 超时 或 受到 怀疑 ， 而 实际 上 来 自 进程 的 消息 <alive> 
仍然 在 传输 中 。 如 果 从 受到 怀疑 的 进程 发 来 的 消息 到 达 , 就 立即 将 它 从 DD 中 删除 , 但 另 一 方面 ， 
4 的 估算 值 会 增加 。 经 过 固定 次 数 这 样 的 修正 之 后 ， 估 算 值 超过 了 的 实际 值 ， 此 后 ， 不 会 出 
现 更 多 的 错误 怀疑 。 由 于 错误 怀疑 数 有 限 ， 它 们 都 会 出 现在 执行 的 一 个 有 限 初始 阶段 ， 这 证 
明 检 测 器 是 最 终 强 精确 的 . 











var Dp set of processes ; 
rp[P] A timer for each process 


Initialization of the detector: 
Dp := @ ; 
forall q do r |g] :=o+ 4 


The sending process, at each multiple of o: 
forall q do send (alive) to q 


The receiving process, upon receipt of (alive from q: 
rplq] =o +p 


Failure detection, when rp[qj elapses: 








图 16-3 完美 故障 检测 器 算法 


set of processes ; 
A timer for each process ; 
KH estimate, initially 1 


Initialization of the detector: 
Dy := 全; 
forall q do rplg] := o + mep 


The sending process, at each multiple of ø: 
forall q do send (alive) to q 


The receiving process, upon receipt of (alive) from q: 
if j € Dp then 
begin D, := D, \ {q} ; 
MEp = Mep + 1 
end ; 
rplq] := o + mep 


Failure detection, when rq] elapses: 
Dp := Dp U {q} 





图 16-4 最 终 完美 故障 检测 器 
16.4.3 小 结 


本 章 通 过 给 出 一 些 易 于 理解 的 基本 结果 ， 引 入 了 故障 检测 器 的 概念 ， 并 在 课堂 上 加 以 介 
绍 。 由 于 这 个 研究 课题 相对 较 新 ， 并 且 引 起 了 国际 研究 界 的 注意 。 因 此 不 可 能 只 选 出 一 些 结 
果 ， 就 能 表明 未 来 的 研究 和 发 展 方向 。 我 们 通过 一 些 关于 故障 检测 器 结果 的 例子 来 结束 本 章 。 

按照 故障 检测 器 模拟 的 概念 [CT96]， 建 立 故 障 检测 器 的 分 级 结构 。 如 果 存 在 利用 .4 提供 
的 信息 并 实现 了 检测 器 8 的 分 布 式 算法 ， 检 测 器 .A 会 模拟 检测 器 8 。 在 这 种 情况 下 ， 称 检测 
a B 比 检测 器 .4 弱 。 

定义 一 种 更 弱 形 式 的 完全 性 : 如 果 每 个 损毁 进程 最 终 永 远 受到 至 少 一 个 正确 进程 的 怀疑 ， 
则 称 检测 器 是 弱 完 全 的 [CT96]。 然 而 ， 容 易 证 明 ， 弱 完全 的 检测 器 可 以 模拟 强 完全 的 检测 器 
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(参见 定义 16.1)， 而 不 减弱 定义 16.2 中 的 精确 性 性 质 。 因 此 ， 在 文献 中 (或 者 在 本 书 中 )， 常 
常 不 考虑 弱 完 全 性 。 

还 有 一 个 问题 就 是 , 能 否 用 ALO S 更 能 的 检测 器 ， 来 解 一 致 性 问题 (如 16.3 节 所 做 的 )。 
Chandra 等 人 [CHT96] 证 明 ， 任 何 一 个 允许 实现 一 致 性 的 检测 器 可 以 模拟 0 S 。 这 个 工作 产生 
了 许多 围绕 故障 检测 的 数学 机 器 和 证 明 技 术 。 

并 不 是 所 有 故障 检测 器 在 实现 过 程 中 都 用 到 超时 : 心跳 (heartbeat) 检测 器 [ACT97] 只 交 
换 异 步 消 息 。 然 而 ， 这 个 检测 器 需要 与 本 章 用 到 的 进程 进行 各 种 交互 ， 用 它 所 解 的 问题 需要 
稍微 做 一 些 设计 。 一 些 有 关 问 题 ， 如 能 异步 地 实现 什么 ， 异 步 实 现 的 检测 器 能 够 解决 什么 问 [514 
题 等 等 ， 它 们 太 复 杂 太 新 颖 ， 在 此 不 进行 讨论 。 517 


习题 
16.1 节 

16.1 第 509 页 列 出 了 正确 进程 在 接收 阶段 ， 收 集 不 同 消息 集 的 各 种 可 能 性 。 对 于 四 种 类 
型 的 检测 器 (定义 16.3) 的 每 一 种 ， 讨 论 是 否 这 种 可 能 性 能 够 出 现 。 

16.2 设 F 是 故障 模式 ， 证明 存 在 1 满足 F(1) =Crash(F), 

在 什么 地 方 ， 你 的 证 明 用 到 了 P 是 有 限 的 这 一 条 件 ? 证 明 如 果 P 是 无 限 进程 集 ， 结 论 不 成 立 。 

16.3 强 精确 性 要 求 比 不 存在 正确 进程 曾经 受到 怀疑 这 一 要 求 更 强 : 

VF:WHED (F): Wt: Vp €Corr(F),q EFt): p EH(q,t) 

给 出 一 个 满足 这 个 性 质 而 在 强 精确 检测 器 中 不 允许 的 故障 模式 和 故障 检测 器 历史 的 例子 ， 
不 满足 。 

16.4 进程 p 先 向 g 发 送 消息 ， 然 后 向 发送。g 和 7 收集 p 的 消息 。 用 一 个 例子 证 明 ， 即 使 检 
测 是 完美 的 ， 也 可 能 出 现 r 接 收 到 消息 ，g 没 有 接收 到 消息 的 情形 。 在 你 的 例子 中 ，g 和 r 必 须 
是 正确 的 。 

16.2 节 

16.5 如 果 在 每 一 轮 中 ， 至 少 有 [个 正确 进程 不 会 受到 怀疑 ， 则 称 故障 检测 器 是 [- 精 确 的 。 
《这 个 性 质 落 含 着 ， 弹 性 的 界限 为 N - 1[， 弱 精确 是 1- 精 确 的 。) 

修改 图 16-1 所 示 的 算法 ， 使 它 在 N - 1+1 轮 中 完成 。 

16.6 把 图 16-2 所 示 的 算法 修改 成 图 14-5 所 示 的 算法 ， 以 便 获 得 一 个 有 限 算 法 ， 或 者 用 最 
终 精 确 检测 器 证 明 这 是 不 可 能 的 。 

16.3 节 
16.7 给 出 图 16-2 所 示 的 算法 执行 的 一 个 例子 ， 其 中 判定 在 不 同 轮 中 出 现 。 
16.4 节 


16.8 在 图 16-3 所 示 的 算法 的 一 次 损毁 和 它 的 检测 之 间 经 过 多 长 时 间 ? | 
16.9 证 明 图 16-4 所 示 的 算法 的 最 终 完 美 性 。 在 每 次 执行 中 ， 最 终 者 满足 关系 me > wh? [519 
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第 17 章 稳 定 性 


本 章 所 考虑 的 稳定 算法 所 实现 的 容错 行为 ， 完 全 不 同 于 前 几 章 中 所 研究 的 健壮 算法 的 容 
错 行为 。 健 壮 算法 沿用 一 种 翡 观 方法 ， 怀 疑 所 有 接收 的 信息 ， 并 通过 足够 的 检查 ， 来 进行 所 
有 步 哺 以 保证 正确 进程 的 全 部 步骤 的 有 效 性 。 在 出 现 故 障 进程 时 ， 必 须 保 证 有 效 性 。 这 就 需 
要 限制 故障 和 故障 模型 的 数目 。 

稳定 算法 是 乐观 算法 ， 它 可 能 引起 正确 进程 表现 不 一 致 ， 但 能 保证 在 所 有 故障 行为 停止 
后 的 有 限时 间 内 、 返 回 到 正确 行为 。 即 ， 稳 定 算法 能 保护 兔 于 验 时 (transient) 故障 ， 假 设 故 
障 最 终 能 被 修复 。 这 种 假设 使 得 我 们 可 以 放弃 故障 模型 ， 以 及 对 故障 数量 的 限制 。 不 考虑 要 
出 错 的 进程 ， 假 设 所 有 进程 运行 正确 ， 但 在 瞬时 故障 期 间 ， 配 置 可 能 遭 到 破坏 。 忽 略 故障 期 
间 计 算 的 历史 ， 把 算法 分 析 开 始 的 配置 作为 (正确 运行 ) 算法 的 初始 配置 。 因 此 ， 如 果 算 法 
最 终 开 始 正确 执行 ( 即 ， 按 照 算法 的 规范 ) ， 而 不 管 它 的 初始 配置 ， 则 称 算法 是 稳定 的 。 

Dijkstra[Dij74] 首 先 提出 了 稳定 性 概念 但 是 直到 20 世 纪 80 年 代 后 期 ， 才 开始 有 较 多 这 方 
面 的 研究 。 因 此 ， 这 个 学 科 相 对 较 新 。 然 而 ， 在 此 后 的 若干 年 直至 本 书面 世 时 ， 出 现 了 大 量 
稳定 算法 和 相关 结果 。 本 章 给 出 了 经 过 选择 的 一 些 研究 成 果 。 

术语 “稳定 ”贯穿 始终 ， 而 在 文献 中 常会 碰 到 “ 自 稳定 ”这 一 术语 。 


17.1 引言 


17.1.1 定义 


可 以 把 稳定 算法 模型 化 为 没有 初始 配置 的 转移 系统 (将 此 定义 与 定义 2.1 进 行 比较 )。 

定义 17.1 系统 是 序 偶 8S= (C ， 一 )， 其 中 C 是 配置 集 ， 一 是 C 上 的 二 元 转移 关系 。5 的 
一 次 执行 是 一 个 最 大 序列 EE= (Yo, n, h 0), RAATH > 0, yi> yin。 

与 定义 2.2 不 同 ， 计 算 的 每 个 〈 非 空 ) 后 缀 现在 也 是 一 次 计算 。 算 法 的 正确 性 ， 即 ， 所 期 
望 的 “进程 一 致 行为 "， 表 示 为 规范 ， 它 通常 是 配置 序列 上 的 一 个 谓词 (通常 用 P 表 示 )。 

定义 17.2 系统 8 稳定 到 规范 P， 如 果 存 在 合法 配置 的 一 个 子 集 C CC ， 具 有 以 下 性 质 。 

(1) 正确 性 KL 中 一 个 配置 开始 的 每 次 执行 满足 已。 

(2) 收敛 性 每 次 执行 包含 C 中 的 一 个 配置 。 

合法 配置 集 通常 是 闭 的 ， 即 ， 如 果 yEC Ay +d, BASEL 。 但 由 于 这 不 用 于 以 下 结果 
的 证 明 中 ， 因 此 在 定义 中 没有 包括 闭 性 。 

定理 17.3 如 果 系 统 9 稳 定 到 规范 已 ， 那 么 8 的 每 次 执行 ， 都 有 一 个 满足 P 的 非 空 后 级 。 

证 明 。 由 收敛 性 质 ， 每 次 执行 包含 一 个 合法 配置 ， 由 正确 性 ， 在 这 个 合法 配置 开始 的 一 
NEREP. 口 

1. 证 明 稳 定性 

合法 配置 的 使 用 可 使 我 们 利用 标准 的 验证 技术 ,证明 算 法 的 稳定 性 。 用 范 函 数 证 明 收 
Sete. 
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5117.4 假设 

(1) 所 有 终止 配置 属于 人 人， 

(2) 存在 函数 广 C -> W， 其 中 W 是 良 基 集 ， 且 对 于 每 次 转移 y -一 6, fly) >f(6) 或 者 6 
EL RE. 

那么 ?= (C ， 一 ) 满足 收敛 性 。 

为 了 证 明正 确 性 ， 人 们 可 以 进行 经 典 算法 分 析 ， 把 L 看 作 初 始 配置 集 。 实 际 上 ， 只 考虑 
EL 中 开始 的 执行 。 

2. 稳定 算法 的 性 质 

较 之 经 典 算法 ， 稳 定 算法 具有 以 下 三 个 基本 优势 。 

(1) 容错 ”正如 在 本 章 引言 中 所 看 到 的 那样 ， 稳 定 算法 为 所 有 瞬时 的 进程 故障 ， 提 供 了 
完全 和 自动 的 保护 。 因 为 算法 可 从 任何 配置 中 恢复 ， 而 不 管 有 多 少数 据 由 于 故障 遭受 破坏 。 

(2) 初始 化 ”取消 了 对 算法 初始 化 的 适合 性 和 一 致 性 要 求 ， 因 为 进程 可 在 任意 状态 开始 
执行 ， 并且 最 终 协调 行为 得 到 保证 。 

(3) 动态 拓扑 结构 ”在 拓扑 结构 发 生变 化 后 ， 计 算 依赖 于 拓扑 结构 的 函数 (路 由 表 、 生 
成 树 ) 的 稳定 算 共 收敛 于 新 解 。 

第 四 个 优点 是 ， 在 17.3.1 小 节 中 讨论 了 “顺序 ”组 合 的 可 能 性 ， 不 需要 终止 检测 。 最 后 对 
于 同一 网 络 问题 ， 研 究 表明 ， 到 有 目前 为 止 的 许多 稳定 算法 都 比 相应 的 经 典 算法 简单 。 然 而 ， 
部 分 原因 是 由 于 这 些 算法 的 复杂 度 没 有 进行 优化 ， 因 此 ， 当 对 稳定 算法 进一步 研究 时 ， 这 个 
“优势 ”可 能 会 消失 。 

另 一 方面 ， 稳 定 算法 有 以 下 三 个 缺点 。 

(1) 初始 不 一 致 性 在 达到 合法 配置 之 前 ， 算 法 可 能 显示 不 一 致 的 输出 。 

(2) 高 复杂 度 ”到 目前 为 止 已 知 的 稳定 算法 ， 通 常 要 比 针对 同一 问题 的 相应 的 经 典 算法 
具有 更 低 的 效率 。 

(3) 不 能 检测 出 稳定 性 ”从 系统 的 内 部 ， 不 可 能 知道 合法 配置 已 经 达到 。 因 此 进程 从 来 
不 会 意识 到 ， 什 么 时 候 它 们 的 行为 已 经 变 得 可 靠 。 l 

3. 伪 稳 定性 

定理 17.3 中 所 证 明 的 稳定 算法 性 质 ， 可 作为 稳定 性 的 另 一 种 定义 : 只 要 求 每 次 执行 有 一 个 
满足 规范 的 后 级 。 然 而 ， 这 种 表示 并 不 等 价 于 我 们 所 做 的 定义 。 因 此 ，Burns 等 人 [BGM93] 将 
它 称 作伪 稳定 性 (pseudo-stabilization ) 。 

为 了 证 明 这 种 差异 ， 考 虑 具有 配置 a 和 b， 且 有 a > a, a> b, b 一 b 的 转移 的 系统 5。 规 
范 P 规 定 “ 所 有 配置 是 相同 的 "。 因 为 5 可 从 a 转移 到 b 至 多 一 次 ， 容 易 证 明 ， 每 次 执行 都 有 一 个 
由 相同 配置 组 成 的 后 级 。 配 置 不 能 被 选 为 合法 的 ， 因 为 在 这 个 配置 开始 的 执行 (a, b, b, ...) 
并 不 满足 P。 因 此 ，5- 执 行 (a，a，a, .…) (尽管 满足 P 自 身 ) 并 不 包含 合法 配置 。 

Burns 等 人 证 明 ， 弱 伪 稳 定性 要 求 ， 可 以 使 没有 稳定 性 解 的 问题 有 解 。 一 个 例子 就 是 数据 
序列 传输 。 另 一 方面 ， 在 伪 稳 定 解 中 (没有 稳定 解 )， 在 满足 规范 P 之 前 ， 系 统 可 执行 的 步 数 
没有 上 界 ， 而 对 于 稳定 算法 ， 却 可 以 给 出 这 样 的 上 界 。 本 章 中 ， 我 们 只 对 稳定 算法 进行 研究 。 


17.1.2 稳定 系统 中 的 通信 
在 本 书 前 面 的 大 多 数 章节 中 ,假设 了 一 个 通过 消息 传递 进行 通信 的 异步 模型 ， 但 是 这 个 
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模型 对 于 研究 稳定 算法 并 不 令 人 满意 。 
首先 考虑 一 个 异步 消息 传递 的 算法 ， 其 中 有 一 个 进程 p»， 对 于 该 进程 ， 每 个 状态 是 一 个 发 
送 状态 〈 即 ，P 在 每 个 局 部 状态 可 以 发 送 消息 )。 系 统 中 有 一 个 仅 由 进程 p 的 发 送行 为 组 成 的 执 


” 行 ， 而 其 他 所 有 进程 在 它们 的 初始 状态 保持 冻结 ， 并 且 这 种 行为 并 不 满足 任何 有 意义 的 非 平 


凡 规范 。 

其 次 ， 考 虑 一 个 算法 ， 其 中 对 于 每 个 进程 ， 存 在 一 些 状态 ， 在 这 些 状 态 进程 并 不 发 送 消 
息 〈 但 可 以 只 接收 消息 或 者 执行 内 部 步 又 )。 如 果 一 个 配置 中 ， 每 个 进程 都 处 于 这 种 状态 ， 且 
所 有 信道 为 空 ， 则 这 个 配置 是 终止 配置 ， 并 一 定 满足 规范 。 而 且 ， 所 有 这 样 的 配置 都 不 满足 
非 平凡 规范 。 

文献 [Tel91a] 中 ， 给 出 了 网 络 变更 算法 的 稳定 版 本 ， 每 个 进程 中 ， 利 用 计时 器 且 消 息 传 输 
时 间 有 上 界 。 在 实际 中 ， 这 个 算法 非常 好 。 但 是 算法 分 析 主 要 是 针对 定时 技术 细节 方面 。 因 
此 ， 我 们 假设 通过 共享 变量 进行 通信 的 更 通用 的 模型 ， 在 这 种 模型 中 ， 一 个 进程 可 以 对 一 个 
变量 进行 写 操作 ， 而 另 一 些 进程 可 对 同一 变量 进行 读 操 作 。 

在 状态 模型 中 ， 进 程 可 以 (自动 地 ) 读 近邻 的 整个 状态 。 在 这 样 的 模型 中 ，p 的 每 个 近邻 
读 取 同一 个 状态 ， 因 此 ， 进 程 不 可 能 将 不 同 信息 传输 到 它 的 各 个 近邻 。 在 链接 -寄存 器 (link- 
register) 模型 中 ， 进 程 间 的 通信 是 通过 两 个 进程 间 共 享 的 两 个 寄存 器 实现 的 。 每 个 进程 可 从 
这 两 个 寄存 器 之 一 读 取 值 而 向 另 一 个 写 入 值 。 通 过 在 它 的 链接 寄存 器 写 不 同 的 值 ， 进 程 可 以 
向 各 个 近邻 传输 不 同 的 信息 。 

我 们 进一步 区 分 读 一 个 (read-one) 模型 和 读 所 有 (read-all) 横 型 。 在 读 一 个 模型 中 ， 进 
程 在 一 个 原子 步 只 能 读 一 个 近邻 的 状态 (或 链接 寄存 器 ) ; 在 读 所 有 模型 中 ， 进 程 在 一 个 原 
子 步 可 以 读 所 有 近邻 状态 。 


17.1.3 例子 : Dijkstra 令 牌 环 


Pijkstra[Dij74] 首 次 提出 了 稳定 算法 。 这 些 算法 在 一 个 进程 环 中 实现 互 乒 (mutual 
exclusion)。 对 于 这 个 问题 ， 假 设 进程 有 时 必须 执行 代码 的 临界 区 (critical section), (AR 
在 任何 给 定时 间 ， 至 多 只 有 一 个 进程 执行 临界 区 。 每 个 进程 被 给 定 一 个 局 部 谓词 ， 当 该 谓词 
为 真 时 ， 表 明 进 程 有 特权 (privilege) 执行 临界 区 。 则 问题 的 规范 为 : 

(1) 在 每 个 配置 中 ， 至 多 一 个 进程 有 此 特权 。 

(2) 每 个 进程 可 以 无 限 次 拥有 特权 。 

我 们 可 以 引入 一 个 令 牌 ， 在 环 上 循环 传递 ， 并 赋予 持 有 令 牌 的 进程 特权 ， 来 解决 这 个 问 
题 。Dijkstra 解 决 方法 的 优点 是 ， 可 以 在 系统 中 没有 令 牌 或 者 有 多 于 一 个 令 牌 的 情形 中 自动 恢 
复 (进程 步 为 O(N?))。 

1. 解 的 描述 

进程 的 状态 表示 为 0:， 是 值 域 为 0,.…，K-1 中 的 一 个 整数 。 其 中 Kk 是 大 于 N 的 整数 。 进 程 i 
可 以 读 o; -， (以 及 a)， 进 程 0 可 以 读 ow-,。 除 进程 0 之 外 ， 所 有 进程 都 是 平等 的 。 RRO; * oil， 
则 进程 i* 0 有 特权 ; 如 果 o。=ow_!， 则 进程 0 有 特权 。 具有 特权 的 进程 也 能 改变 它 的 状态 ( 假 
定 它 在 完成 临界 区 的 操作 之 后 ， 或 者 根本 不 再 需要 执行 后 者 时 ， 就 可 以 改变 状态 ) 。 

进程 状态 改变 总 是 引起 它 的 特权 丢失 。 进 程 i * 0 通过 赋值 0; := o;,， 将 oi 设 为 0; .，( 当 能 
够 这 样 做 时 ， 即 ai * oi-,)。 进 程 0 通过 赋值 0。:= (o+ 1) mod 上 ， 将 oo 设 成 不 等 于 ow_，( 当 
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前 相等 时 ) 。 

2. 稳定 性 证 明 

特权 的 定义 蕴含 着 ， 在 每 个 配置 中 ， 至 少 一 个 进程 有 特权 ( 即 ， 不 存在 终止 配置 )。 如 果 
没有 除 0 以 外 的 进程 具有 特权 ， 那 么 ， 对 于 每 个 :> 0，o; =0 KREA, O =ow_1!， 且 进程 0 
具有 特权 。 然 而 ， 没 有 步 又 会 增加 特权 进程 的 数目 ， 因 为 改变 状态 的 进程 ， 同 时 失去 了 特权 ， 
在 这 一 步 中 ， 惟 一 能 够 获得 特权 的 进程 是 它 的 后 继 。 

为 了 证 明 稳 定性 ， 定 义 L 为 配置 集 ， 且 配置 中 只 有 一 个 进程 具有 特权 。 

引 理 17.5 在 合法 配置 中 开始 的 执行 满足 已 。 

证 明 。 在 一 个 合法 配置 中 ， 只 有 一 步 是 可 能 的 ， 即 ， 通 过 惟一 具有 特权 的 进程 。 在 这 一 
步 中 ， 该 进程 失去 了 它 的 特权 ， 但 是 因为 没有 不 带 特 权 的 配置 ， 它 的 后 继续 必须 获得 特权 。 
因此 ， 特 权 在 环 上 循环 传递 ， 在 每 N 个 连续 配置 中 ， 每 个 进程 拥有 一 次 特权 。 o 

5117.6 Dijkstra A FESR MAIR BIL 。 

证 明 。 由 于 不 存在 终止 配置 ， 系 统 的 每 次 执行 是 无 限 的 。 

一 次 执行 包含 进程 0 的 无 限 多 步 ， 因 为 如 果 没 有 进程 0 的 一 步 ， 至 多 能 发 生 (1/2)N(N-1) 
步 。 而 进程 的 一 步 去 掉 了 i 的 特权 ， 只 可 能 将 特权 交 给 进程 i +1， 范 函数 为 


F=3(N-i) 
ics 





其 中 8 = {i : i> 1 且 进程 用 特权 }， 它 是 关于 进程 每 一 步 的 递减 函数 (进程 0 除外 )。 

在 初始 配置 % 中 ， 至 多 出 现 N 个 不 同 状态 ， 因 此 ， 至 少 有 K-N 个 状态 没有 出 现在 yo 中 。 
为 进程 0 在 每 一 步 中 ， 状 态 GRK) 增加 ， 至 多 (进程 0 的 ) N 步 之 后 ， 进 程 0 达到 一 个 未 在 % 中 
出 现 的 状态 。 除 进程 0 之 外 的 所 有 进程 复制 状态 ， 因 此 进程 0 首次 计算 这 样 的 状态 ， 它 的 状态 
在 环 中 是 惟一 的 。 由 于 进程 0 的 状态 是 惟一 的 ， 因 此 在 配置 满足 o == … = oy = ovat, € 
不 会 再 次 得 到 特权 ， 这 描述 了 一 个 合法 配置 。 

由 于 系统 在 进程 0 的 第 (N +1) 步 之 前 达到 一 个 合法 配置 ， 并 且 其 他 进程 ( 至 多 ) 出 现 (1/2) 
N(N-1) 个 连续 步 ， 因 此 ，( 至 多 ) 经 过 (N +1) 1/2N(N-1) + N = O(N) 步 ， 达 到 合法 配 
置 。 
利用 更 精确 的 分 析 ， 可 以 证 明 步 数 界限 为 O(N?)， 参 见习 题 17.2。 口 

推论 17.7 Dijkstra 令 牌 环 算法 稳定 到 互 斤 。 

3. 一 致 解 

称 稳定 算法 是 一 致 的 ， 如 果 所 有 进程 相同 ， 且 没有 标识 区 别 它们 。 找 互 斥 以 及 其 他 问题 
的 一 致 解 近年 来 备 受 关注 ， 这 种 兴趣 主要 是 由 于 它们 在 理论 上 的 重要 性 所 致 。 然 而 ， 在 实际 
中 ， 一 致 解 也 具有 吸引 力 ， 因 为 进程 标识 像 其 他 进程 变量 一 样 ， 通 常 存储 在 存储 器 中 ， 因此 
一 个 毁坏 的 配置 可 能 侵犯 所 要 求 的 标识 惟一 性 。 

一 致 稳定 算法 也 是 同一 问题 的 一 个 匿名 网 络 算 冰 ， 因 此 不 可 解 的 匿名 网 络 (第 9 章 ) 问题 
不 存在 一 致 稳定 解 。 通 过 假设 对 称 配 置 ， 并 证 明 可 以 不 确定 地 保持 对 称 性 ， Dijkstra[Dij82] 证 
明 ， 如 果 环 规模 不 是 素数 ， 则 不 存在 一 致 (确定 的 ) 令 牌 环 。 假设 已 知 环 规模 为 素数 ，Burns 
和 Pachi[BP88] 提 出 了 一 致 令 牌 环 算法 ， 

可 用 类 似 方法 证 明 ， 选 举 问题 、 生 成 树 和 其 他 一 些 破坏 对 称 的 问题 不 可 能 存在 确定 一 
致 稳定 算法 ,但 是 如 果 可 以 利用 随机 化 ， 就 可 能 存在 确定 一 致 稳定 解 。 由 于 本 章 关注 的 是 稳 
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定性 ， 而 不 关注 匿名 ， 我 们 在 后 续 章节 中 ， 假 设 进程 具有 惟一 名 字 ， 或 领导 人 可 用 。 
17.2 图 论 算法 


如 果 算 法 的 目的 是 达到 后 置 条 件 罗 ， 可 将 它 的 规范 设 为 “每 个 配置 满足 y”。 我 们 称 5 随 着 
AE, WETERE L., ME 

(1) L ÆR, 并且 YE L 蕴含 w(Y) ; H 

(2) 每 次 计算 达到 上 的 一 个 配置 。 

算法 可 能 终止 ， 但 并 不 总 是 出 现 这 种 情形 。17.2.1 节 给 出 一 种 环 定向 算法 ， 它 最 终 可 以 经 
历 不 同 (但 是 有 向 的 ) 配置 的 无 限 序 列 。17.2.2 小 节 给 出 找 最 大 匹配 问题 的 一 个 算法 ， 其 中 的 
合法 配置 是 终止 的 。 


17.2.1 环 定向 


在 环 定向 问题 中 ， 我 们 考虑 N 个 进程 的 无 向 环 ， 其 中 每 个 进程 将 它 的 一 个 链 路 标 以 sucec 
(后 继 )， 另 一 个 标 以 pred (前 驱 )。( 如 果 两 个 标号 是 相同 的 ， 进 程 立即 改变 其 中 一 个 标号 ) 。 
称 链 路 pg 上 进程 p 的 标号 为 1。， 在 初始 时 ， 不 做 标号 全 局 一 致 性 的 假设 。 定 向 算法 的 目标 是 计 
算 环 上 一 致 的 方向 侦 听 。 

定向 问题 要 求 系统 达到 后 置 条 件 峭 ， 该 条 件 定义 为 “对 于 每 条 边 pg ， 甸 为 succ 当 且 仅 当 岂 
为 pred”。Israeli 和 Jalfon[I1J90] 证 明 ， 在 读 状 态 模 型 中 ， 可 能 不 存在 确定 解 。 我 们 给 出 了 链接 
寄存 器 模型 的 Israeli-Jalfon 算 法 。 所 给 出 的 算法 是 一 致 算法 。 






var sp : (S, R, I); 





(1) {stutep = I A^ s4 = S A lyp = succ} 
Sp := R ; if lpg = succ then flip 






(2) {sp = SA lpg = succ A Sq = RA lgp = pred} 
sp :一 了 






(3) {sp = RA lpg = pred A (8g = S A lap = succ)} 
S 





Sp :一 
(4) {sp = 34 = S A lpg = lap = succ} 
Sp := R ; flip 





(5) {sp = 8g = I A lpg = lap = succ} 
Sp := S 






procedure flip: reverse succ and pred for p 
图 17-1 环 定向 算法 


如 图 17-1 所 示 的 算法 在 算法 中 ， 除 了 利用 保存 pred 或 succ 的 链接 寄存 器 之 外 ， 还 利用 变量 
5， 其 值 为 9$、R 和 17。 在 一 步 中 ， 进 程 p 考 虑 它 的 状态 、 近 邻 4 和 链接 寄存 器 的 状态 ， 如 果 这 5 个 
国 值 中 有 一 个 值 为 trwe ， 则 进程 改变 状态 。 进 程 循环 传递 令 牌 ， 每 个 进程 将 它 的 后 继 设 置 到 最 
后 转发 的 令 牌 的 方向 ; 如 果 两 个 令 牌 相遇 ， 其 中 一 个 就 要 被 删除 。 最 终 ， 所 有 剩 下 的 令 牌 将 
在 加 一 个 方向 遍历 ， 这 使 得 令 牌 被 定向 ， 剩 佘 令 牌 继续 传递。 
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在 3 状态 ， 进 程 等 待 转发 一 个 令 牌 (向 当前 它 的 后 继 ) ; 而 在 R 状 态 ， 进 程 等 待 接收 一 个 
令 牌 ; 在 /状态 ， 进 程 处 于 空闲 状态 。 如 果 满 足下 述 条 件 之 一 ， 则 进程 持 有 令 牌 ， 这 些 条 件 是 : 
进程 的 状态 在 8 中 ， 或 者 在 R 中 ， 且 它 的 前 驱 不 在 状态 8 中 。 在 算法 的 第 (2) 步 中 ， 令 牌 从 p 向 
4 移动 ; 在 算法 的 第 (4) 或 (5) 步 中 ， 令 牌 在 p 中 分 别 遭 受 破坏 或 者 被 创建 。 这 些 步 称 为 令 
牌 步 〈token step)。 而 算法 的 (1) 和 (3) 步 ， 对 令 牌 的 位 置 不 产生 影响 ， 称 这 些 步 为 无 声 
% (silent step)。 在 执行 第 (1) 步 之 后 ， 同 一 进程 的 下 一 步 是 第 (3) 步 , 在 第 (3) 步 后 ， 
下 一 步 是 第 (4) 步 或 者 第 (2) 步 ， 这 限定 了 无 声 步 数 与 令 牌 步 数 成 线性 关系 。 

在 行为 (1) 中 ， 如 果 g 想 要 将 令 牌 转发 给 空间 进程 p，p 同 意 接收 令 牌 (尽管 它 还 没有 移 
动 )， 并 且 使 9 成 为 它 的 前 驱 。 在 行为 (2) 机 P 观 察 到 ， 它 的 后 继 同意 接收 令 牌 ， 它 想 要 传 
和 输 ， 并 变 成 空闲 ， 于 是 移动 令 牌 。 在 行为 (3) 中 ，p 接 收 来 自 q 的 令 牌 ， 并 观察 到 ，g 变 成 空 
闲 ， 则 开始 向 它 的 后 继 传 输 令 牌 。 REAREA ANAIEI, E (4) 中 ， 在 不 同方 向 遍历 
的 两 个 令 牌 相遇 , 在 (5) 中， 两 个 空闲 进程 定向 不 一 致 。 在 这 些 情形 中 ， 两 个 进程 都 被 激活 ， 
第 一 个 进程 进行 一 步 ， 打 破 了 对 称 性 “。 在 行为 (4) 中 ， 进 程 p 接 收 4 的 令 牌 ， 隐 含 地 破坏 了 
它 自己 的 状态 。 在 行为 (5) 中 ，p 产 生 一 个 令 牌 ， 它 将 决定 4 的 方向 。 

每 个 行为 的 效果 如 图 17-2 所 示 ， 其 中 每 个 进程 的 状态 和 定向 可 用 其 后 继 方向 上 的 箭头 表示 。 


R 
I 
5 


无 论 p 的 初始 
方向 如 何 ， 行 为 (1) 
都 是 叮 应 用 的 。 


Ar | 





图 17-2 算法 17-1 中 行为 的 效果 

称 配 置 是 合 靶 的 ， 当 且 仅 当 它 是 定向 的 ， 即 ， 所 有 稍 头 指向 同一 个 方向 。 

5117.8 L 是 闭 的 ， 并 且 yE LBS Y(y). 

证 明 。 由 上 人 的 选择 ， 合 法 配置 被 定向 ， 这 蕴含 着 引 理 的 第 二 部 分 。 此 外 ， 只 有 类 型 (1). 
(2) 和 (3) 中 的 步 艰 会 出 现 。 因 为 当 存在 不 同 定向 的 近邻 时 ， 步 又 (4) 和 (5) 才 被 激活 。 
ER (2) 和 (3) 从 不 会 翻转 进程 的 定向 。 如 果 p 与 4 定向 在 同一 方向 ，(1) 也 不 会 改变 进程 
的 方向 。 这 就 证 明了 C 的 闭 性 。 口 

命题 17.9 终止 配置 是 合法 的 。 

证 明 。 设 y 是 终止 的 ，Yy 中 没有 进程 处 于 状态 R， 因 为 如 果 s, = R， 那 么 由 行为 BG), 或 者 
进程 p 被 沿 活 ， 或 由 行为 (2)， 它 的 前 驱 被 激活 。 

如 果 7 没 有 被 定向 ， 则 存在 两 个 进程 相互 指向 对 方 。 即 ， 对 于 进程 p 和 g，/,, = lyp = succ. 
如 果 p 和 4 中 有 一 个 处 于 空闲 ， 则 行为 (1) 被 激活 ， 如 果 p 和 4 都 处 于 空闲 ， 则 行为 (5) 被 激 
活 ， 如 果 p 和 9 都 在 发 送 ， 则 行为 (4) 被 激活 。 由 此 可 得 ， 没 有 接收 进程 的 一 个 终止 配置 被 定 
向 ， 因 此 所 有 终止 配置 被 定向 。 口 

定理 17.10 协议 收 仇 到 合法 状态 。 


© lsraeli 和 Jalfon 考 虑 了 一 种 更 精细 粒度 的 行为 可 分 性 ， 需要 明确 地 打破 对 称 性 。 根据 [1J90] ， 算 法 17.1 对 
于 中 心 守护 程序 有 效 。 
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证 明 。 令 牌 创建 以 对 的 形式 17 出现 ， 并 且 对 于 5 种 行为 的 任何 一 种 ， 都 不 会 形成 这 样 的 
对 。 因 此 仅 在 初始 空闲 的 进程 产生 一 个 令 牌 ， 并 作为 那个 进程 的 第 一 步 。 这 香 含 着 一 次 执行 
中 所 存在 的 令 牌 总 数 不 超 过 N。 

如 果 在 执行 期 闻 ， 配 置 中 存在 一 个 令 牌 ， 这 个 令 牌 已 经 移动 次， 那么 k+1 个 进程 序列 
(以 持 有 令 牌 的 进程 作为 结束 ) 被 一 致 定向 。 所 有 这 些 进 程 已 经 转发 了 令 牌 ， 且 采用 了 它 的 方 
向 ， 没有 可 能 会 再 次 打 乱 这 个 方向 的 令 牌 在 此 令 牌 “之 后 ”被 创建 。 因 此 如 果 一 个 令 牌 已 经 
移动 N-1 次 ， 所 有 进程 同样 被 定向 ， 则 配置 是 合法 的 。 

因为 在 执行 期 间 ， 不 存在 多 于 NN 个 的 不 同 令 牌 ,在 至 多 VY 个 令 牌 步 后 ， 达 到 合法 配置 。 O 


17.2.2 最 大 匹配 


图 的 一 个 匹配 是 边 的 集合 ， 满 足 图 中 没有 一 个 节点 会 依附 于 多 于 一 条 的 边 。 如 果 这 个 集 
合 不 能 用 图 中 更 多 的 边 扩充 ， 则 称 匹 配 是 最 大 的 。 可 用 边 数 的 线性 时 间 来 构造 图 的 最 大 匹配 。 
底 次 考虑 每 条 边 ， 如 果 这 条 边 没 有 依附 于 匹配 中 已 有 的 任何 边 ， 就 把 这 条 边 加 入 到 匹配 中 。 
然而 ， 这 个 算法 本 质 上 是 顺序 的 ， 并 不 适合 于 分 布 式 执行 。 我 们 将 会 给 出 Hsu and Huang 
[HH92] 提 出 的 构造 最 大 匹配 的 一 个 稳定 算法 。 
1. 匹配 算法 
进程 p 中 有 一 个 变量 pref,， 它 的 值 属于 Neigh, U {nil}, Rap HWA (preferred 
neighbor)。 如 果 pref, = 4q，p 选 择 了 它 的 近邻 9， 与 之 匹配 ， 即 ， 将 边 pq 包 含 在 匹配 中 。 如 果 p 
没有 选择 相 匹 配 的 同伴 ， 则 有 pref, = nil。 根 据 p 的 选择 和 其 近邻 的 选 树 ， 我 们 区 分 5 种 情形 。 
如 果 p 已 经 选择 ?， 且 如 果 4 还 未 做 出 选择 ， 那 么 p 等 待 4; 如 果 4 已 经 选择 p， 那 么 p 与 4 匹配 ; 如 
果 g 已 经 选择 了 一 个 不 是 p 的 近邻 ， 那 么 p 进 行 链接 。 当 p 还 没有 做 出 选择 时 ， 如 果 p 的 所 有 近邻 
都 已 匹配 ， 那 么 p 是 死 锁 的 ; 如 果 存 在 一 个 未 匹配 的 近邻 ， 那 么 p 是 自由 的 。 表 示 为 
wait(p) = pref, = qENeigh, a pref, = nil 
match(p) = pref, =q ENeigh, a pref, = p 
chain(p) = pref, =q ENeigh, ^ pref, = r€Neigh, ar # p 
dead(p) = pref, = nila Yq ENeigh, : match(q) 
free(p) m pref, = nil a 3q ENeigh, : -match(q) - 


算法 要 求 的 后 置 条 件 为 
wy = Wp: (match(p) v dead(p)) 


var pref, : Neigh, U {nil} ; 


Mp: {pref, = nil A pref, =p} 
pref, := 4 


{pref, = nil A Vr € Neigh, : pref, #p A pref, = nil} 
pref, :二 g 


: {prefp =q A pref, # p^ pref, # nil} 
pref , := nil 





图 17-3 最 大 匹配 算法 
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命题 17.11 Ry, RSM={(p, pref,): pref, + ni 是 最 大 匹配 。 
证 明 。 如 果 存 在 一 条 边 pg E M， 那 么 由 M 的 定义 ，pref, = 4 或 者 pre = p， 但 由 于 4g 不 等 竺 
或 链接 ， 后 者 还 蕴含 pref, = 9g， 由 此 可 得 ， 至 多 一 条 依附 于 p 的 边 属 于 M， 因 此 M 是 一 个 匹配 。 
为 了 证 明 M 是 最 大 匹配 ， 假 设 M Ut{pq} 也 是 匹配 ， 其 中 pg 疾 M， 那 么 M 没 有 包含 依附 于 p 
的 边 ， 这 表明 dead (p) Vfree(p) 成 立 ， 因 此 ， 由 可 得 ，dead (p) 成 立 。 但 是 dead (p) 蕴含 
match(q)， 因 此 M 包 含 依附 于 4 的 一 条 边 ， 这 与 用 pq 对 M 进 行 的 可 能 的 扩展 相 了 矛盾 。 口 
算法 的 描述 基于 读 - 所 有 状态 模型 ， 由 每 个 进程 p 的 三 种 行为 组 成 。 参 见 图 17-3 所 示 的 算 
法 。 如 果 进 程 p 是 自由 的 ， 且 进程 q 已 经 选择 了 p， 则 进程 p 与 近邻 4 匹配 (行为 M,)。 如 果 p 是 
自由 的 ， 但 还 未 匹配 ， 则 它 选 择 一 个 自由 近邻 ， 如 果 这 样 做 是 可 能 的 (行为 S$,)。 如 果 p 正 在 
链接 ， 则 它 处 于 释放 状态 (行为 U， )。 
2. 算法 分 析 
引 理 17.12 配置 y 是 终止 的 ， 当 且 仅 当世 (y) RÈ. 
证 明 。 行 为 Mo 得 到 p 人 允许 ， 仅 当 近 邻 4 正 处 于 等 待 状态 ， 行 为 $, 要 求 p 是 自由 的 ， 行 为 U, 要 
求 p 正 在 链接 ， 因 此 y(y) 蕴含 在 y 中 没有 行为 得 到 人 允许。 
如 果 y 不 成 立 ， 则 存在 p 满 足 ，p 正 在 链接 、 等 待 或 是 自由 的 。 在 一 次 链接 p 中 ，U, 得 到 允 
许 ， 并 且 如 果 p 正 等 待 9， 则 Mg 得 到 允许 。 最 后 ， 假 设 p 是 自由 的 ， 且 g 是 一 个 未 匹配 的 近邻 。 
因为 p 没 有 匹配 ，4 不 是 死 锁 的 。 如 果 4 正 在 等 待 ， 匹 配 行为 在 它 的 一 个 近邻 中 得 到 允许 ， 且 如 
果 g 正 在 链接 ， 则 Us 得 到 人 允许。 最终， 如 果 g 是 自由 的 ，p 和 g 可 以 相互 选择 。 因 此 ， 如 果 多 不 
成 立 ， 配 置 不 是 终止 的 。 口 
引 理 17.13 图 17-3 所 示 的 算法 以 DO(M2) 步 达到 终止 配置 。 
证 明 。 用 数 对 (c + f+ w，2c +f) 定义 范 函 数 F， 其 中 c、f 和 w 分 别 表示 链 数 、 自 由 进程 
数 和 等 待 进程 数 。 我 们 将 证 明 ，F 是 步 数 的 递减 函数 (按照 词典 次 序 )。 首 先 可 知 ，-- 个 已 匹 
配 的 进程 会 永远 保持 匹配 ， 而 一 个 死 锁 进程 永远 保持 死 锁 状态 。 因 此 c + f+ w 从 不 递增 。 
M,: 当 p 是 自由 的 ， 并 且 它 的 近邻 9 正在 等 待 ， 应 用 该 行为 ， 使 得 两 者 相 匹配 。 同 时 使 < + 
f+ w 减 少 2。( 如果 p 和 4 的 近邻 变 成 死 锁 ， 这 个 和 可 能 还 会 减少 。) 
S: 当 p 是 自由 的 ， 可 应 用 该 行为 ， 使 得 p 变 为 等 待 状态 ， 同 时 2c + /减少 1。 没 有 等 待 进程 
变 成 自由 的 ， 或 是 链接 的 ， 因 为 仅 当 没 有 进程 等 待 p， 且 没 有 自由 进程 变 成 链接 的 时 
候 ， 才 能 应 用 该 行为 。 
U: 当 p 是 链接 的 ， 可 应 用 该 行为 ， 使 得 p 变 成 自由 的 (如 果 有 未 匹配 的 近邻 )， 或 p 变 成 
死 锁 的 (如 果 所 有 进程 都 已 匹配 )， 因 此 ， 至 少 使 2c + /减少 1， 链接 p 的 近邻 可 能 变 
成 等 待 ， 因 此 会 进一步 减少 c。 
由 于 c +f+ w 上 限 为 N，2c +f 上 限 为 NW。 因而，F 的 不 同 值 的 数目 至 多 为 (N +1)(2N +1)， 
因此 ， 每 次 执行 在 2N? + 3N 步 后 终止。 口 
易 证 明 ， 取 所 有 满足 的 配置 作为 合法 配置 ， 图 17-3 所 示 的 算法 稳定 到 yy。 


17.2.3 选举 和 生成 树 构造 


Afek, Kutten and Yung[AKY90] 提 出 一 个 稳定 算法 ， 用 于 计算 网 络 上 的 一 棵 生成 树 ， 其 
中 最 大 进程 是 根 。 我 们 描述 了 读 - 所 有 状态 的 模型 上 的 算法 (尽管 该 算法 也 可 用 于 读 - 一 个 状 
态 的 模型 )， 并 假设 网 络 是 连通 的 。 在 本 小 节 中 ， 我 们 利用 词 首 大 写 表示 进程 变量 ， 词 首 小 写 

















表示 谓词 。 
进程 p 保 持 变 量 Root,、Par, 及 Dis,。， 用 以 描述 树 结构 。 我 们 引入 以 下 谓词 。 
root(p) = Root, =pA Dis, =0 
child( p,q) = Root, = Root, > pA Par, =q ENeigh, a Dis, = Dis, +1 
tree(p) = root, V Aq: child( p,q) 
Imax(p) =Yq ENeigh, : Root, > Root, 
sat(p) = tree(p) A Imax(p) 


算法 所 需 的 后 置 条 件 为 wy， 用 Vp : sat(p) €X. 

引 理 17.14 wREA, WH (p, q): child(p, q) } 形 成 一 棵 以 最 大 进程 为 根 的 生成 
树 。 

证 明 。 由 于 对 于 所 有 p，imax(p) 得 到 满足 ， 且 网 络 是 连通 的 ， 所 有 进程 具有 相同 Root 值 。 
具有 最 小 Dis 值 的 进程 po 没有 Dis, = Dis, +1 的 近邻 9， 因 此 roor(po) 成 立 ，Roor 变 量 的 公共 值 
为 po。 但 对 于 所 有 P + po, child(p) 成 立 ， 并 且 ， 因 为 child(p，gq) = (Dis, > Dis,)， 因 此 和 孩 
子 关系 是 无 环 的 。 引 理 得 证 。 

1. 算法 描述 1 

为 了 建立 ww，sat(p) 为 真 的 进程 p 从 不 改变 它 的 那些 描述 树 结构 的 变量 (参见 图 17-4 所 示 
WIA). salp) 为 假 的 进程 p»， 通 过 变 成 它 的 具有 最 大 Root 值 (行为 J,) 的 近邻 的 一 个 子 节 
点 ,试图 建立 sat(p)。 

称 Root 的 值 为 假 根 (false root)， 如 果 在 网 络 中 ， 不 存在 具有 那个 标识 的 进程 ;初始 时 可 
能 存在 假 根 ， 但 执行 中 不 会 创建 假 根 。 算 法 设计 中 的 主要 问题 是 ， 防 止 进 程 无 限 频 繁 地 变 成 
带 假 根 进程 的 孩子 节点 。 为 此 ， 可 用 三 步 完成 将 进程 p 加 入 4 的 树 中 的 过 程 。 首 先 ，p 成 为 根 
(行为 B,)， 然 后 ， 请 求 允 许 加 入 (行为 A,)， 最 后 当 gq 对 加 入 认可 时 ， 将 p 加 入 (J,)。 

其 余 4 种 行为 (C6,F,，G, 和 R,) 实现 请 求 /应 答 机 制 , 而 且 仅 被 满足 satr(p) 的 进程 p 执 行 。 
变量 Re9qv 包 含 进程 ， 它 的 加 入 请 求 p 正 在 处 理 。From 是 进程 p 的 近邻 ，p 读 取 来 自 该 近邻 的 请 
求 70, 是 进程 p 向 其 进行 转发 的 近邻 ，Dir。( 值 4sk 和 Grant) 表示 请 求 是 否 得 到 同意 。 我 们 定义 
以 下 谓词 。 














idle( p) = Req, = From, = To, = Dir, = udef 

asks(p,q) = ((root(p)a Req, = p) V child(p,q)) A To, =q A Dir, = Ask) 
forw(p,q) = Req, = Req, A From, =qa To, = paTo, = Par, 
grant(p,q) = forw(p,q)a Dir, = Grant 


进程 p 清 除 请 求 处 理 的 变量 (行为 C,)， 如 果 它 当前 没有 处 理 请 求 ， 并 且 变 量 并 非 未 定义 。 
然后 ， 如 果 p 处 于 空 闪 状态 ， 但 有 一 个 近邻 9， 向 p 发 出 请 求 ( 想 要 加 入 的 根 ， 或 转发 请 求 的 p 
的 子 节 点 )， 进 程 p 可 能 开始 转发 这 个 请 求 (行为 P,) ， 如 果 p 是 根 节点 并 转发 请 求 ， 它 就 会 同 
意 请 求 (行为 G,)， 如 果 p 将 这 个 请 求 转发 给 它 的 父 节点 ， 且 父 节 点 同意 请 求 ， 那 么 p 就 传递 这 
个 请 求 许可 (行为 R,)。 

2. 算法 正确 性 

Afek et al.[AKY90] 利 用 行为 推理 ， 通 过 证 明 执 行 中 的 某 些 性 质 ， 证 明了 算法 的 正确 性 。 

请 求 /应 答 机 制 确保 ,进程 加 入 到 一 棵 具有 假 根 的 树 中 的 次 数 是 有 限 的 。 因 为 不 存在 的 根 
的 请 求 不 会 得 到 许可 ， 初 始 时 ， 只 存在 有 限 多 的 假 的 许可 。 因 此 ， 没 有 一 个 Root 变 量 会 永远 
包含 一 个 假 根 。 包 含 假 根 且 具有 最 小 Dis 值 的 进程 不 满足 iree， 并 会 重新 将 Root 设 置 成 自己 的 
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标识 。 由 此 可 得 ， 最 终 不 存在 假 根 ， 并 且 最 终 具 有 最 大 标识 


更 大 Root 值 时 ， 这 是 满足 sat 的 惟一 途径 。 


var Rootp, Parp , Disp ; (* Describe tree structure *) 
Req,, Fromy, Top, Dirp ; (* Request forwarding *) 


: (* Become root *) 


{ atree(p) } 
Root, := p ; Disp := 0 ; 
Req, := p ; Top := q ; Dir, := Ask 


: (* Ask permission to join *) 


{ tree(p) A —lmaz(p) } 


Select q € Neigh, with maximal value of Root, ; 
Req, := p ; From, := p ; Top := q ; Dirp := Ask 


: (* Join tree *) 
{ tree(p) A =lmaz(p) A grant( Top, p) } 


Par, := q ; Root, := Root, ; Disp := Disg +1; 


Req, := Fromy := Top := Dir, := udef 


: (* Clear request variables *) 
{ sat(p) A ~q : forw(p, q) A ~idle(p) } 
Req, := From, := Top := Dir, :=.udef 


: (* Forward request *) 
{ sat(p) A idle(p) A asks(q, p) } 
eqp := Reg, ; From, := q ; Top := Par, 
: (* Grant join request *) 
{ sat(p) A root(p) A forw(p, q) A Dir, = 
Dir, := Grant 


R,: (* Relay grant *) 
{ sat(p) A grant(Parp, p) A Dirp = Ask } 
Dirp := Grant 


图 17-4 生成 树 算法 


Ask } 





因为 在 没有 


如 果 一 个 节点 不 属于 以 最 大 节点 为 根 的 树 ， 但 在 那 棵 树 中 确 有 一 个 近邻 ， 则 节点 不 满足 
St 谓词 ， 并 尝试 加 入 ， 而 树 中 的 节点 从 不 遗弃 它 。 由 于 所 有 不 正确 的 请 求 最 终 都 会 从 树 中 消 


失 ， 节 点 继续 向 树 中 增加 ， 直 到 这 棵 树 扩散 至 整个 网 络 。 
17.3 稳定 方法 学 


稳定 性 要 求 ， 使 得 分 布 式 算法 设计 相当 复杂 。 但 可 利用 一 般 范 型 。 在 17.3.1 小 节 中 ， 第 一 
阶段 讨论 了 既 使 不 能 检测 出 稳定 性 如 何 进行 稳定 计算 。 我 们 集中 在 Herman 的 研究 [Her91] 上 ， 
但 是 所 用 技术 已 知 ， 并 且 前 面 已 经 用 过 。 在 17.3.2 小 节 中 ， 证 明了 凡是 能 够 选择 恰当 的 度量 ， 


表示 成 找 “ 最 小 路 径 ” 的 问题 ， 都 存在 稳定 算法 。 
17.3.1 协议 组 合 


在 许多 情形 中 ， 达 到 期 望 的 后 置 条 件 y 的 算法 由 两 个 阶段 组 成 。 第 一 阶段 达到 后 置 条 件 9， 
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第 二 阶段 前 置 条 件 为 9， 并 达到 后 置 条 件 钞 。 有 无 数组 合算 法 的 例子 ,包括 本 书 中 涉及 的 一 些 
算法 。 

(1) 路 由 大 多 数 路 由 方法 从 计算 每 个 节点 的 路 由 表 开 始 ， 计 算 之 后 ， 利 用 这 些 路 由 表 
转发 包 。 

(2) 选举 在 网 络 上 选举 领导 人 原因 通常 在 于 ， 期 望 在 网 络 中 接着 执行 集中 式 算法 。 

(3) ARARA 死 锁 检测 的 全 局 标记 算法 (图 10-8 所 示 的 算法 ) 首先 计算 基本 计算 的 快照 ， 
然后 对 所 得 到 的 配置 进行 分 析 。 

(4) 图 的 着 色 ”对 于 平面 图 的 6- 着 色 问 题 ， 通 过 计算 图 的 一 种 合适 无 环 定 向 (参见 定义 
5.12)， 然 后 按照 与 这 个 方向 一 致 的 次 序 对 图 中 节点 着 色 。 

利用 终止 检测 协议 ， 可 以 指导 在 两 个 经 典 的 分 布 式 算法 之 间 进 行 控制 转换 。 在 第 一 阶段 
中 添加 这 样 的 协议 〈 参 见 第 8 章 ) ， 当 它 表 明 第 一 阶段 已 经 完成 时 ( 即 ， 已 经 建立 6 后 ) BER 
开始 执行 第 二 阶段 。 当 所 设计 的 算法 一 定 要 是 稳定 的 ， 此 时 就 不 能 使 用 类 似 的 方法 。 因 为 不 
可 能 知道 (按照 稳定 的 方式 ) 第 一 阶段 的 终止 性 。 

幸运 的 是 ， 稳 定 算法 的 类 似 组 合 更 简单 : 第 二 阶段 的 执行 可 在 任意 时 刻 开始 ， 即 使 第 一 
阶段 不 能 完成 时 。 如 果 一 个 经 典 算法 (对 于 第 二 阶段 ) 在 它 的 前 置 条 件 被 建立 之 前 开始 ， 可 
能 达到 不 可 恢复 的 故障 状态 。 这 就 需要 检测 第 一 阶段 的 终止 性 。 然 而 ， 如 果 第 二 阶段 是 稳定 
的 ， 尽 管 在 前 置 条 件 达到 值 rwe 之 前 ， 有 一 些 错误 步 ， 它 最 终 还 是 建立 了 它 的 前 置 条 件 。 

1. 并 -组 合 规则 

在 组 合算 法 算 子 的 定义 中 ，Herman[Her91] 将 这 些 观察 形式 化 。 假 设 程序 是 由 变量 集 以 及 
作用 在 这 些 变量 上 的 原子 步 组 成 。 

定义 17.15 ” 设 9, 和 8 是 程序 ， 满 足 由 8 写 入 的 变量 不 会 出 现在 8 中 ， 符 号 9) 回 9) 表 示 S 和 
Sz 的 并 组 合 ， 它 表示 由 SI 和 5s 中 的 所 有 变量 及 行为 组 成 的 程序 。 

在 定义 中 ，5, 表 示 实 现 计算 第 一 阶段 的 程序 ，5, 表 示 实 现 第 二 阶段 的 程序 。 对 5, 和 35, 的 限 
制 意味 着 5; 的 结果 不 被 5, 所 用 ， 即 ， 不 存在 从 5 到 5S 的 “反馈 ”。51 中 的 变量 在 5, 中 作为 常量 。 

现在 设 9 是 作用 在 5, 中 变量 上 的 谓词 ，y 是 作用 在 5; 中 变量 上 的 谓词 。 在 组 合算 法 中 ，9 由 
$1 确定 ， 随 后 由 5 确定 。 这 两 个 技术 条 件 必 须 铭记 在 心 。 首 先 ， 组 合 的 执行 对 这 两 个 程序 都 
是 公平 的 。 这 样 做 是 排除 一 些 执行 ， 在 这 些 执行 中 所 有 步 出 现在 一 个 阶段 ， 而 阻止 另 一 阶 
继续 执行 。 l 

定义 17.16 ”Si 园 9: 的 执行 对 于 3 是 公平 的 ， 如 果 它 包含 8) 中 的 无 限 多 步 ， 或 者 包含 一 个 无 
限 后 级 ， 在 这 个 后 级 中 ，5; 中 没有 一 步 可 以 进行 。 

其 二 ， 当 条 件 6 已 经 被 确定 时 ， 假 设 5, 不 能 改变 $, 所 读 的 变量 。 这 就 排除 了 通过 为 它 提供 
不 同 的 满足 6 的 变量 设置 ，5, 来 阻止 $, 中 程序 执行 的 情形 。 

定理 17.17 如 果 以 下 四 个 条 件 成 立 : 

(1) 程序 8 稳定 到 8; 

(2) AAS AB AY, ROR SZ; 

(3) 一 旦 g 成 立 ， 程 序 91 不 能 改变 S? 所 读 的 变量 ; R 

(4) 所 有 执行 对 于 9 和 8 都 是 公平 的 。 

ZA, SELAR Y, 

EA, BAHL RS BS AT AER, KALAR. AFS BSR By, ig 
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RAVES AVE BS LKR. HFS 四 3 的 一 次 执行 下 = (y, yo), REORMBR PAG 
被 删除 的 序列 Cy, nO, «de 

WE = (yo. Yio --) AES 固 $: 的 一 次 执行 ， 并 考虑 序列 ED。 因 为 8: 不 会 写 人 3 的 变量 ，y 
中 的 所 有 改变 都 是 按 S 中 的 步骤 来 进行 ， 这 昔 含 着 E0) 是 8 的 一 次 执行 。E 对 于 8 的 公平 性 蕴含 
着 ,如果 EW" 是 有 限 的 ， 那 么 最 后 配置 对 于 5 是 终止 的 。 因 为 $1 稳定 到 6， 由 此 可 得 ，6 被 确定 ， 
即 存在 i， 满 足 对 于 每 个 } > i, O(y) HH. 

我 们 下 面 考虑 在 y: 中 开始 的 E 的 后 缀 E;， 即 序列 (Yis Yai o) 在 这 个 后 缀 中 ， 对 于 每 个 
配置 ，6 为 真 ， 这 蕴含 着 ( 由 定理 的 第 三 个 假设 ) 51 没 有 改变 $, 所 读 变 量 。 因 此 ， 序 列 (y2， 
Yi, a) 是 5 的 一 次 执行 ， 如 果 有 限 ， 该 序列 结束 于 5; 的 终止 配置 中 。 如 果 9 成 立 ，5; 稳 定 
到 多 ， 由 此 可 得 ，V 被 建立 ， 并 保持 为 真 。 口 

如 果 遂 过 提供 足够 的 范 函 数 有 和 所 ( 值 域 分 别 为 W; 和 W,)， 可 证 明 S1, 和 5, 的 稳定 性 ， 就 能 给 
出 S1B15; 的 范 函 数 。 定义 函数 f(yY) = (fi), (7Y2))。 当 51 的 每 一 步 使 人 减少 ， $; 的 每 一 步 
使 有 减少， 并 剩 下 有 未 变 时 ， 那 么 按照 5; BBS, 中 的 每 一 步 使 得 /按照 字典 次 序 减少 。 然 而 ， 如 果 
有 一 个 程序 确定 了 它 的 后 置 条 件 ， 而 没有 终止 (例如 ， 环 定向 程序 )， 仍 然 需要 公平 性 条 件 保 
证 两 个 程序 的 执行 。 参 见 文 献 [Fra86] 关 于 公平 性 问题 的 讨论 。 

2. 应 用 : 平面 图 的 6- 着 色 问题 

作为 协议 组 合 原理 的 一 种 应 用 ， 我 们 提出 一 种 算 靶 ， 它 可 以 稳定 到 平面 图 的 6- 着 色 问题 。 
假设 进程 p 有 变量 c,， 取 值 为 {1，2，3，4，5，6}; 如 果 图 中 近邻 着 不 同 颜色 ， 则 称 图 是 6- 着 
色 的 。 即 如 果 如 下 定义 的 谓词 为 真 ， 

p=(Vpq EE:c, #c,) 


算法 的 开发 过 程 接近 证 明 过 程 。 这 样 的 着 色 算法 存在 ， 并 基于 以 下 事实 。 

事实 17.18 一 个 平面 图 至 少 有 一 个 度 小 于 等 于 5 的 节点 。 

引 理 17.19 一 个 平面 图 有 一 个 无 环 定向 ， 其 中 的 每 个 节点 出 度 至 多 为 5。 

证 明 。 对 节点 数 用 归纳 法 证 明 。 单 个 节点 的 情形 是 平凡 的 。 因 此 考虑 图 中 有 两 个 或 者 多 
个 节点 的 情形 。 至 少 有 一 个 节点 v 的 度 小 于 等 于 5。 图 G-{v} 是 平面 图 ， 并且 只 少 一 个 节点 。 
因此 ， 由 归纳 法 ， 它 有 无 环 方向 图 ， 在 这 个 图 中 ， 每 个 节点 的 出 度 至 多 为 5。 在 G 的 定向 中 ， 
图 G-{v} 中 所 有 边 按照 这 个 方向 定向 ， 而 依附 于 v 的 边 则 远离 v 定 向。 显然 ， 所 得 方向 图 是 无 环 
的 ， 并 且 不 存在 5 条 以 上 的 出 边 节点 。 o 

定理 17.20 (6- 色 定理 ) 平面 图 是 6- 可 着 色 的 。 

证 明 。 设 G 是 平面 图 。 考 虑 G 的 无 环 方向 图 。 其 中 不 存在 有 5 条 以 上 出 边 的 节点 。 因 为 方 
向 图 是 无 环 的 ， 可 把 节点 编号 为 v1 到 v,， 满足 如 果 存 在 一 条 从 y 到 v, 的 有 向 边 ， 那 么 j > i。 按 照 
岂 到 w 的 次 序 对 节点 着 色 。 编 号 性 质 意 味 着 ， 在 节点 v 之 前 ， 只 有 "的 出 近邻 被 着 色 。 这 一 点 以 
及 方向 图 的 性 质 蕴 含 着 ， 在 "之 前 ， 至 多 有 "的 5 个 近邻 被 着 色 ， 因 此 ，* 的 着 色 可 不 同 于 它 的 
所 有 (已 着 色 的 ) 近邻 。 口 

6- 色 定理 的 证 明 过 程 ， 表 明了 计算 6- 着 色 问 题 的 算法 设计 过 程 。 第 一 阶段 计算 引 理 17.19 
中 表示 的 无 环 方向 图 。 第 二 阶段 按照 与 定向 一 致 的 次 序 对 节点 着 色 。 为 了 表示 无 环 方向 图 ， 
给 定 进程 p 一 个 整数 变量 z， 我 们 定义 边 pg 为 从 p 到 4 的 有 向 边 ， 用 殉 表 示 。 如 果 


Xp <x, V(x, =x, A p<q) 
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显然 ， 只 有 一 种 方式 对 每 条 边 确 切 定向 〈 即 ， 下 和 殉 中 只 有 一 种 成 立 )， 且 方向 图 是 无 
环 的 。 设 out(P) 表示 p 的 出 边 的 数目 ， 即 
out( p) =# {q Neigh, :pq} 


第 一 阶段 希望 的 后 置 条 件 是 9， 定 义 为 
0=(Vp:out(p) < 5) 


为 了 确定 6， 程 序 $1 由 每 个 进程 的 一 次 操作 组 成 ， 如 果 p 有 多 于 5 条 的 出 边 : 
D,: {out(p) >5} 
X, i= max{x,: q E Neigh, } +1 

则 将 p 的 所 有 边 定向 p。 

定理 17.21 程序 $1 稳定 到 0， 并 且 如 果 0 成 立 ， 那 么 %, 值 保持 不 变 。 

证 明 。 配 置 是 终止 的 ， 当 且 仅 当 6 为 真 。 因 此 如 果 程 序 停 止 ，6 就 被 确定 ， 而 如 果 6 被 确定 ， 
变量 z 保 持 为 常数 。 

为 了 证 明 $, 的 终止 性 ， 我 们 “引用 ” 引 理 17.19 中 的 无 环 有 向 图 ， 然 而 ， 这 个 引用 的 有 向 
图 不 必 是 由 Si 计算 出 来 的 。 引 理 17.19 毕 含 ， 存 在 节点 ， 关 ，… 的 枚 举 ， 满 足 每 个 节点 至 多 有 
5 个 具有 更 大 下 标的 近邻 。 称 边 vvj 为 错误 的 ， 如 果 它 被 定向 为 总 ， 而 i > j。 设 f(yY) 是 表 (m, 
m2，.…)， 这 里 是 依附 于 v 的 错误 边 数 。 行 为 D, 的 每 次 应 用 使 城 少 ( 按 字 典 次 序 )。 考 虑 它 在 
节点 wj 中 的 应 用 ， 它 的 具有 最 小 下 标的 出 近邻 是 v;。 由 于 vw 至 少 有 6 个 出 近邻 ,但 至 多 有 5 个 更 
大 下 标的 近邻 ，i <j， 因 此 边 vvj 是 错误 的 ,但 不 再 是 这 样 一 条 边 ， 因 此 使 n 减 少 ,而 对 于 k <i, 
不 受 影响 。 

要 确定 罗 ， 程 序 $; 也 由 每 个 进程 的 一 次 操作 组 成 。 在 这 个 操作 中 ， 如 果 c, 等 于 这 些 颜 色 之 
一 ， 并 且 存 在 未 用 颜色 ， 则 p 采 用 一 种 不 同 于 它 后 继 的 颜色 b: 

Cy: { (3q: PaNcp=cq) A (Wrst. ph: c +b) } 

co :=b 

定理 17.22 程序 8 终止 ， 并 且 如 果 6 为 真 ， 那 么 最 终 配 置 满足 Up。 

证 明 。 为 了 证 明 终 止 性 ,利用 被 定向 在 无 环 方向 图 中 的 那些 边 , 因此 存在 可 数 个 节点 ，v， 
Vo, WE, BRR A BPR. Ee (y) = (m, m, ..), Hm HO, mE 
< 上 与 每 个 w 的 后 继 着 色 不 同 ; 否则 mm 为 1。 节 点 w 应 用 行为 C,， 将 mm 值 从 1 变 为 0， 对 于 | > i, tbh 
可 能 只 将 m 值 从 0 变 为 !。 因 此 g 的 值 按 字典 次 序 减少 。 

最 后 ,假设 9 成 立 ， 并 考虑 不 应 用 行为 C, 的 配置 。 进 程 p 至 多 有 5 个 后 继 ， 因 此 存在 一 种 颜 
色 b E{1，2，3，4，5，6} ,不 为 它 的 任 一 后 继 所 用 。 由 于 C, 的 阔 值 为 假 ， 由 此 c, 与 每 个 后 继 
的 颜色 不 同 。 

最 后 ， 对 于 每 条 边 qr，r 是 q 的 后 继 ， 或 者 g 是 7 的 后 继 ， 这 蕴含 着 c, c 口 

S 和 8$: 的 并 组 合 如 图 17-5 所 示 的 算法 。 

定理 17.23 图 17-5 所 示 的 算法 稳定 到 攻 。 

证 明 。 可 以 构造 并 组 合 。 因 为 8 中 的 变量 (cp) 并 不 出 现在 9 中。 上 述 表 明 ，5S, 稳 定 到 6， 
在 确定 它 之 后 ， 并 不 改变 zz 的 值 (定理 17.21)， 且 如 果 9 成 立 ，5, 稳 定 到 (定理 17.22)。 

为 了 证 明 由 定理 17.17，$8 回 $: 稳 定 到 多， 仍 需 证 明 这 种 组 合 是 公平 的 。 由 定理 17.22， 在 
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S$! 的 每 两 步 之 闻 ， 只 有 $s 中 的 有 限 步 。 这 证 明了 关于 5 的 公平 性 。 由 定理 17.21，5, 终 止 ， 这 证 
明 关于 8: 的 公平 性 。 o 


var Z, : integer ; 
p £ {1, 2, 3, 4, 5, 6} ; 


py E Tp < Tq V (tp = zg AP <4) ; 
out(p) = #{q € Neigh, : på} ; 


D,: { out(p) > 5 } 
Lp := max{zq : q € Neigh} +1 


Cp: { (Aa: p4 A cp = cq) A (Yr s.t. pr : cr b) } 
cp :=b 





图 17-5 平面 图 的 6- 可 着 色 算法 
17.3.2 计算 最 小 路 径 


本 小 节 给 出 解决 一 类 问题 的 稳定 算法 ， 这 类 问题 可 以 变 成 通过 恰当 选择 路 径 的 代价 函数 
寻找 最 小 路 径 。 例 子 不 仅 包括 计算 路 由 表 (直接 )， 而且 包 括 计算 深度 优先 搜索 树 。 更 令 人 惊 
讶 的 是 ， 还 包括 选举 问题 (参见 习题 17.12)。 我 们 首先 给 出 一 个 代数 设置 中 的 最 小 路 径 问 题 ， 
然后 提出 修正 算法 (图 17-6 所 示 的 算法 )， 这 个 算法 稳定 到 最 小 路 径 。 在 本 节 最 后 ， 给 出 了 它 
在 实际 中 的 应 用 。 


var K, 


>:D; 
Lp : Neigh, U {nil} ; 


Cp: Kp := min(cp, mint foal Ha) : q € Neigh,}) ; 
if Kp = cp then Lp = nil 
else Lp := q 8.t. Kp = fipqg(Kq) 





图 17-6 最 小 路 径 更 新 算法 
1. 代价 函数 和 最 小 路 径 的 性 质 
假设 给 定 从 路 径 到 全 序 域 U0 的 函数 DD。 HFR, 值 D(x) 称 为 x 的 代价 。 从 p 到 p 的 长 度 
为 0 的 空 路 径 (p) 的 代价 ， 用 cs 表示 ， 并 假设 空 路 径 为 p 所 知 。 我 们 考虑 代价 函数 ， 对 于 这 个 
代价 函数 ， 可 以 递增 地 计算 路 径 代价 。 这 意味 着 ， 非 空 路 径 的 代价 可 被 计算 为 
D(po,.., Pris Pra) = Soan (CDCPo Pp) 


Jog: ABU: U 一 U, AR HR (edge function )， 每 一 条 边 pg 有 一 个 边缘 函数 。 
路 径 r = (Po. Pis ses Pias Pr) BUR GT PT AE RT BL, | ( (Foira (Er) .…)。 定 义 
Soera Co or) …) BERRE), WD) Afal) BERMEAK (和 边缘 函数 ) 满 
足以 下 公理 。 

(1) 单调 性 对 于 每 条 边 pg 和 x E U， 如 果 x 是 一 条 到 gq 且 不 含 p 的 简单 路 径 ， 那 么 D (x) < x 
= fog (D(n)) <fa (x) 

(2) 周期 增加 如 果 zx 是 回路 ， 那 么 对 于 所 有 xz EU, f(x) >x 
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(3) 长 度 增加 ”存在 数 B， 满 足 对 于 长 度 大 于 等 于 有 的 每 条 路 径 p， 每 个 r EU, URKE 
小 于 等 于 N-1 的 每 条 简单 路 径 x，、 有 fp (x) > D(x). 

对 于 每 个 p， 最 小 路 径 问 题 是 计算 任何 以 p 为 结束 点 的 路 径 最 小 代价 ， 以 及 最 小 代价 路 径 
上 它 的 前 驱 q (如 果 最 小 路 径 为 空 ， 则 为 mi )。 用 上 (pP) 表示 最 小 路 径 的 代价 ，%(P) 表示 它 
的 前 驱 。 以 下 定理 表述 了 最 小 路 径 的 存在 性 ， 极 其 具有 的 重要 性 质 。 

定理 17.24 

(1) 对 于 每 个 p， 存 在 一 条 结束 于 p 的 简单 路 径 X(p)， 满 足 所 有 结束 于 Pp 的 路 径 代 价 至 少 为 
D(x(p)). 

(2) 存在 生成 森林 〔 称 为 最 小 路 径 森 林 )， 满 足 对 于 每 个 p， 从 根 到 p 的 〔 疏 一 ) BRAK 
#D(x(p)). 

证 明 。 对 于 (1): 因为 只 有 有 限 多 条 简单 路 径 结 束 于 p ， 我 们 可 以 选择 x (p) 作为 结束 于 P 
的 最 小 简单 路 经 。 由 r(P) 的 选择 ， 所 有 结束 于 p 的 简单 路 径 代价 至 少 为 D(n(p))。 含 有 回路 
的 路 径 代价 (由 回路 增加 和 单调 性 可 得 ) 大 于 去 掉 回 路 得 到 的 简单 路 径 的 代价 ， 因 此 这 些 路 
径 代价 有 界 D(r(P) )。 这 就 表明 r(P) 证 明了 定理 的 第 一 部 分 。 

对 于 (2): 作为 最 小 路 径 ， 不 必 是 惟一 的 。 要 求 对 定理 的 第 二 部 分 特别 关注 。 取 出 现在 
最 小 路 径 中 的 所 有 边 所 得 到 的 图 不 一 定 是 森林 。 像 定理 4.2 中 考虑 的 最 优 汇 集 树 ， 最 小 路 径 森 
林 不 是 惟一 的 ， 但 是 可 能 构造 这 样 一 个 森林 。 如 下 所 示 。 

对 于 每 个 节点 p， 选 择 它 的 父 节点 pg(p) 如 下 。 如 果 空 路 径 (P) 是 最 优 的 ， 则 4%(pP) = 
nil; 否则 pg(p) 是 4 的 近邻 ， 满 足 到 p 的 最 小 路 径 存 在 ， 且 在 这 条 最 小 路 径 上 有 倒数 第 二 的 节 
点 9g。 考 虚 边 p，#(p)， 对 于 gp(p) *nil 的 情形 。 

由 单调 性 ， 对 于 p(p) ni 的 每 个 ，k(p) >fl (9(p))。 于是， 如 果 C 是 所 形成 的 
图 中 的 一 条 回路 (从 p 到 p)， 那 么 %(p) >fc ( %(p))， 这 与 回路 增加 性 质 了 矛盾 ， 因 此 所 选 的 
边 定 义 了 一 个 森林 。 

由 对 根 的 归纳 证 明了 这 个 森林 所 要 求 的 性 质 。 口 

观察 可 见 ， 在 证 明 中 ， 无 需 用 到 长 度 增加 性 质 。 仅 需 证 明 ， 初 始 配置 中 的 错误 信息 ， 最 
终 在 计算 最 小 路 径 的 稳定 算法 中 被 去 掉 。 

现在 规定 一 个 最 小 路 径 问 题 算法 所 要 求 的 后 置 条 件 : 

ya(Vp:K, = K(P)AL, = Gp) 
确定 Y 的 经 典 ( 非 稳定 的 ) 算法 由 每 边 上 的 一 个 操作 组 成 ， 称 为 推送 (pushing) 这 条 边 。 
Pog: Up (Ky) < Kp} 
K, := fø (Ks) ; Ly:=q 

变量 &o 初 始 化 为 cc。 可 以 证 明 断 言 & > «(p) 是 不 变 式 。 为 了 证 明 活动 性 ， 我 们 必须 假 
设 推送 对 于 每 一 条 边 是 公平 的 ， 即 ， 在 一 个 无 限 执行 中 ， 每 条 边 会 被 无 限 频繁 地 推送 。 我 们 
对 通 向 pz 的 最 小 路 径 上 的 节点 用 归纳 法 ,证明 K.< k (p) 的 建立 过 程 。 读者 可 以 比较 Chandy- 
Misra 计 算 最 小 路 径 的 算法 (图 4-7 所 示 的 算法 )。 

2. 更 新 算法 

为 了 以 稳定 的 方式 建立 %， 通 过 沿 着 边 推动 , 有 关 现 有 路 径 的 信息 可 能 在 图 中 流动 。 然 而 ， 
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仍然 需要 从 系统 中 去 掉 出 现在 初始 配置 中 的 错误 信息 ， 即 ， 去 掉 那 些 不 存在 通 向 p 的 相应 路 径 
的 K, 的 值 。 这 可 以 通过 在 越 来 越 长 的 路 径 上 移动 该 信息 做 到 ， 路 径 满足 按照 长 度 增 加 的 性 质 ， 
最 终 错 误 信 息 将 被 拒绝 ， 以 支持 与 现 有 路 径 相关 的 信息 。 

更 新 算法 由 每 个 节点 的 一 个 操作 组 成 ， 在 算法 中 ， 计 算 空 路 径 和 路 径 的 最 小 代价 ， 路 径 
的 代价 被 存储 在 它 的 近邻 中 ， 参 见 图 17-6 所 示 的 算法 。 在 算法 分 析 中 ， 正 如 在 推动 算法 中 所 
做 的 那样 ， 假 设 执行 对 于 每 个 进程 都 是 公平 的 ， 即 ， 在 每 次 执行 中 ， 各 进程 可 计算 无 限 多 次 。 

定理 17.25 更 新 算法 稳定 到 最 小 路 径 。 

证 明 。 因 为 C, 总 是 活动 的 ， 每 个 执行 是 无 限 的 ， 公 平 性 假设 允许 我 们 将 执行 划分 成 如 下 
的 轮 (round )。 第 1 轮 结束 时 ， 每 个 进程 至 少 已 经 计算 一 次 。 第 ; +1 轮 结束 时 ， 每 个 进程 在 第 i 
轮 结束 后 至 少 已 经 计算 一 次 。 

HREH, REK Æ N (p) 的 下 界 。 定 义 %;(p) 为 到 p 的 ， 长 度 小 于 等 于 i 的 路 径 上 的 最 
小 代价 ， 我 们 认为 ， 从 第 ; 轮 结束 起 的 任何 时 刻 ， 有 K, < kx(p)。 对 i 进行 归纳 ， 来 确定 这 一 声 
明 。 

当 i =1 时 : 空 路 径 代价 为 c,， 是 长 为 0 的 到 p 惟 一 路 径 ， 由 代码 可 证 明 ， 在 第 一 个 C, 步 之 后 ， 
K, < Cpo 

Si +1 时 : 设 x 是 到 p 长 度 至 多 为 :的 最 小 路 径 ， 如 果 z 的 长 度 为 0， 而 p 执 行 每 步 后 ，K, < 
D(x), 那么 在 : +1 轮 结束 后 同样 成 立 。 假 设 * 是 非 空 路 径 ， 即 ， 路 径 p 和 边 wp 的 连接 ，p 的 长 度 
BSAI-1. HVA, EPERE, K, < D(p)。 由 此 可 得 ， 在 i 轮 结 束 后 p 执 行 完 每 一 步 ， 
Kos fø (D(p)) = D(r)。 在 计 1 轮 结束 时 ，p 至 少 执行 一 个 这 样 的 步 ， 自 那 一 轮 结束 起 ， 表 明 
K,<D(x). 

由 于 最 小 路 径 不 含 回 路 ， 它 的 长 度 受 N-1 所 限 ， 这 蕴含 着 (p) = kwi(p)， 因 此 从 第 N 
轮 结束 起 ，K, < & (p)。 

为 了 证 明 最 终 Ks 是 % (p) 的 上 界 。 我 们 将 要 证 明 ， 在 第 ; 轮 之 后 ，K, 值 与 一 条 现 有 的 路 径 
对 应 ,或 者 与 经 过 至 少 i 次 跳 数 的 已 经 壳 历 过 的 初始 信息 对 应 。 定 义 K, 的 初始 值 为 K+。 我 们 声 
W, WRK, =K, MARR pM en, HD(x) = ,或 者 存在 从 7 到 p 的 路 径 p， 满 足 K =f, 
(Ky). Ri, MARKER RRR, 那么 p 的 长 度 至 少 为 i。 对 一 次 执行 中 的 步骤 用 归纳 法 ， 
可 得 这 个 声明 。 

归纳 基础 : 初始 时 ，K, = fK), EP (r) 是 长 度 为 0 的 路 径 。 因 此 K, 可 能 对 应 一 条 现存 
路 径 ， 也 可 能 不 与 现存 路 径 对 应 。 

归纳 步 : 考虑 p 在 一 步 中 计算 的 K 值 。 如 果 K = c,， 它 就 是 一 条 到 p 的 现存 路 径 (长 度 为 0) 
的 代价 ， 结 论 成 立 。 否 则 ，K = fs (Ks)。 由 归纳 假设 ，Ks 是 (1) 到 g 的 路 径 x 的 代价 ， 或 (2) 
存在 从 7 到 g 的 路 径 p， 满 足 K, = f。(K;)。 在 第 一 种 情形 ，x。 gp 是 一 条 代价 为 f,, ( D(x)) = fog 
(Ki) = K 的 现存 路 径 ， 结 论 成 立 。 在 第 二 种 情形 ,kK = fu Uf, (K*)) = ftp. ap) (Ky). iti, An 
RARER BER, 那么 K, 就 在 第 i-1 轮 或 稍 后 被 计算 ， 通过 归纳 ， 这 芥 含 着 p 的 长 度 至 少 为 
i-1, Alto: qp 的 长 度 至 少 为 i。 

结果 是 长 度 增加 公理 的 一 个 应 用 。 在 第 8 轮 的 结束 时 ，f, K) 超过 了 任何 现存 简单 路 径 
的 代价 ， 这 表明 某 些 到 p 的 现存 路 径 的 代价 是 K, 的 下 界 。 因 此 ， 在 第 B 轮 的 结束 时 ， 对 干 每 个 p， 
Ks = K(p). 容易 验证 ，L, 的 值 满足 为 p(p) 所 设置 的 要 求 ， 这 薄 含 着 ， 边 (p, L) 定义 了 一 








个 最 小 路 径 森 林 。 口 
如 果 网 络 规模 已 知 ， 可 以 在 不 满足 它 的 路 径 代价 函数 上 实现 长 度 增加 性 质 。 修 改 路 径 代 
价 ， 使 它 也 包括 长 度 。 当 比较 代价 时 ， 长 度 大 于 等 于 N 的 路 径 总 是 大 于 长 度 小 于 等 于 N-1 的 路 
径 。 为 了 形式 地 描述 这 种 修改 ， 设 给 定 代价 函数 D。 用 D'(x) = (D(x), Il) 定义 代价 函数 
D'，p 的 空 路 径 的 代价 为 c, = (cp O)e Mol C k) = (fin(C), k+l) 表示 边缘 函数 。 路 径 
代价 比较 如 下 
(Cki) < CR) Kk < Nak, >2N)v(C <C) 


所 有 简单 路 众 可 以 按照 D' 定 序 , 就 像 按 照 D 定 序 一 样 ， 这 表明 保持 了 单调 性 。 同 时 修改 后 ， 
还 保持 了 回路 增加 性 质 。 因 为 长 度 至 少 为 N 的 路 径 的 代价 大 于 长 度 小 于 N 的 路 径 代价 ， 因 此 满 
是 长 度 增加 的 性 质 。 

3. 应 用 : 路 由 

更 新 算法 的 直接 应 用 出 现在 路 由 表 的 计算 中 。 像 变更 算法 一 样 ， 每 个 目的 节点 分 别 进行 
计算 。 固 定 目 的 节点 yY， 如 果 r 在 * 开 始 ， 定 义 D(r) 为 r 的 权 ( 即 ，r 中 边 上 的 权 值 之 和 ) ; 否 
WA. Rp =v, Wike, = 0; 否则 设 为 >， 并 通过 设置 f,(C) = C +wm (其 中 mm 为 边 pg 上 
的 权 值 )， 可 以 递增 地 计算 D(r)。 

由 边缘 晴 数 的 另外 一 些 性 质 ， 可 以 得 出 它 的 单调 性 。 由 网 络 中 的 回路 有 正 的 代价 这 一 假 
设 可 得 回路 增加 性 质 。 为 了 证 明 长 度 增加 性 质 ， 注 意 只 有 有 限 多 个 简单 回路 ， 设 5 是 一 个 简单 
回路 的 最 小 权 值 ，w 是 任何 一 条 边 上 的 最 大 权 值 。 长 度 小 于 等 于 N-1 的 路 径 ， 它 的 权 值 小 于 N,， 
而 长 度 为 B= N(Nw)/6 的 一 条 路 径 包 含 多 于 ( Nw )/6 条 简单 回路 ， 并 且 权 值 大 于 Nw。 

因此 ， 用 更 新 算法 可 以 计算 出 到 * 的 距离 (对 于 * 选 定 的 近邻 ， 到 v 的 最 短路 径 上 的 第 一 个 
近邻 )。 为 了 建立 完整 的 路 由 表 ， 对 于 每 个 目的 节点 ， 可 以 并 行 地 执行 算法 。 

4. 应 用 : 深度 优先 搜索 树 

可 以 证 明 ， 按 照 字典 次 序 选 择 到 每 个 进程 的 最 小 简单 路 径 ， 定 义 了 一 棵 深度 优先 搜索 生 
成 树 ， 它 的 根 是 网 络 中 的 最 小 进程 。 因 此 ， 用 更 新 算法 可 以 构造 一 棵 深度 优先 搜索 树 。 

定义 出 现在 路 径 中 的 节点 表 为 x 的 代价 ， 即 ，c, = (p) 和 fs (0) = op。 比较 按照 字典 次 序 
进行 ， 但 是 简单 路 径 总 是 小 于 含有 回路 的 路 径 : 


0<T< (0 是 简单 路 径 而 t 不 是 ) V (0o<,T) 


字典 序 性 质 章 含 着 单调 性 。 同 样 回 路 增加 性 质 成 立 ， 这 是 因为 包含 回路 的 路 径 大 于 简单 
路 径 。 长 度 增加 性 质 成 立 ， 是 因为 长 度 大 于 等 于 N 的 路 径 包含 回路 ， 这 使 它们 大 于 简单 路 径 。 
因此 ， 更 新 算法 可 以 计算 到 每 个 节点 的 最 小 简单 路 径 。 接 着 要 分 析 所 得 最 小 路 径 森 林 的 性 质 。 

首先 ， 讨 论 由 一 棵 树 组 成 的 森林 ， 以 最 小 节点 为 根 。 称 这 个 最 小 节点 为 r。 对 于 每 个 节点 
P， 存 在 从 r 到 p 的 简单 路 径 ， 来自 r 的 一 条 简单 路 径 小 于 从 其 他 节点 到 p 的 路 径 ， 因 此 到 p 的 最 
小 路 径 在 r 中 开始 。 

其 次 ， 对 于 近邻 p 和 gq，K。4 GRA, ap (CELT MRR). EXE, SEK (p) 
ALK (q), 不妨 假设 %(p) <%(q)。 因 为 最 小 路 径 是 简单 路 径 ， 可 得 %(p) < s(a), Et 
CERERE, qA HRE kr (p) 中 ， 否 则 它 到 4 的 前 缀 是 到 4 的 一 条 路 径 ， 且 按 字 典 次 序 小 
于 %(q), 这 与 % (gq) WEA. (AE, K(p) .9 是 到 4 的 简单 路 径 的 代价 ， 这 理 含 着 上 (9) 


wn 
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< K(p)+q. Wik, K(p) < K(q) <i K(p)+ q. RAZA, K(p) 4 Kla), 或 等 价 地 ， 
在 最 小 路 径 树 中 ，p 是 4 的 祖先 。 

这 两 个 性 质 ， 即 

(1) 森林 由 一 棵 树 组 成 ， 且 

(2) 对 于 近邻 p 和 gq，K ,4 qÈ K, 4 pp 

强 含 着 更 新 算法 所 计算 的 最 小 路 径 森 林 是 一 棵 深度 优先 搜索 树 。 更 新 算法 的 应 用 由 
Herman 提 出 [Her91]， 他 扩展 了 该 算法 ， 采 用 的 方法 是 计算 网 络 中 的 分 离 节 点 (如果 去 掉 分 离 
节点 ， 就 会 使 网 络 断 开 )。 


17.3.3 结论 和 讨论 


本 节 研 究 的 两 个 策略 ， 在 稳定 算法 的 设计 中 是 非常 有 用 的 。 并 组 合 可 用 于 设计 由 两 个 
(或 多 个 ) 时 间 上 有 序 步 组 成 的 算法 ， 更 新 算法 可 被 用 于 求解 能 够 被 表示 为 寻找 每 个 进程 的 最 
小 路 径 的 问题 。 

存在 一 些 方法 ， 可 自动 地 将 任意 算法 转换 成 稳定 算法 (满足 同一 规范 )。 为 了 达到 这 个 目 
$R» Katz and Perry[KP93] 提 出 以 下 机 制 。 并 发 地 执行 给 定 的 经 典 算法 P， 系 统 反 复 计算 P 的 全 
局 状态 的 快照 ， 并 验证 所 构造 的 配置 是 否 是 P 的 可 达 配 置 。 如 果 情 况 不 是 这 样 ， 复 原 协 议会 重 
新 初始 化 系统 到 P 的 一 个 初始 配置 。 然 而 ， 这 个 想法 的 实现 ， 由 于 需要 快照 计算 和 复原 的 稳定 
算法 ， 因 此 面临 许多 技术 上 的 问题 。 


习题 


17.1 节 


17.1 证 明 引 理 17.4。 

17.2 证明 Dijkstra 令 牌 环 在 O(N?) 步 达到 合法 配置 。 给 出 一 个 界限 为 N 的 2 次 的 范 函 数 ， 
它 随 着 算法 的 每 一 步 递减 ， 来 缩短 分 析 过 程 。 

17.3 WRK > N (而 不 是 像 在 课文 中 假设 的 那样 K > N)， 证 明 Dijkstra 令 牌 环 已 经 稳定 。 
( 见 文献 [Hoe99].) 


17.2 节 


17.4 修改 环 定向 算法 (图 17-1 所 示 的 算法 )， 使 它 在 建立 后 置 条 件 后 终止 。 

17.5 (HA) 设计 一 个 确定 辕 环 方向 的 稳定 算法 ， 算 法 最 好 能 终止 。 

17.6 证 明 用 链接 寄存 器 读 ~ 所 有 模型 ， 可 以 一 致 地 实现 最 大 匹配 算法 。 

17.7 证 明 最 大 匹配 算法 在 N2 + O(N) 步 稳定 ， 并 证 明 在 景 坏 情况 下 ， 该 算法 有 为 Q(N2) 
的 步 数 的 下 界 。 

17.8 设计 构造 最 大 独立 集 的 稳定 算法 ， 并 计算 稳定 之 前 的 最 大 步 数 ， 

17.9 给 出 一 个 范 函数 ， 用 来 证 明 图 17-4 所 示 算 法 的 终止 性 。 

17.3 节 


17.10 证 明 外 平面 图 是 3- 可 着 色 的 。 设 计 一 个 计算 外 平面 图 的 3- 着 色 问 题 的 稳定 算法 。 
17.11 设计 一 个 计算 平面 图 的 5- 着 色 问 题 的 稳定 算法 。( 见 文献 [McH90] 或 关于 图 算法 的 





其 他 课本 ) 
17.12 

的 计算 。 
17.13 
17.14 


证 明 通 过 给 出 合适 的 路 径 代 价 函 数 ， 更 新 算法 可 用 于 选举 和 广度 优先 搜索 生成 树 


给 出 一 个 计算 网 络 规模 的 稳定 算法 。 
证 明 如 何 用 更 新 算法 计算 一 棵 树 的 深度 。 
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附录 A 伪 代 码 使 用 约定 


本 书 中 的 算法 没有 用 现 有 程序 设计 语言 描述 ， 而 是 用 伪 代 码 描述 。 伪 代码 简洁 ， 且 用 户 
友好 ， 而 真正 的 程序 往往 因为 一 些 涉 及 严格 语法 的 细 广 ， 而 变 得 睡 浴 难 慌 。 

类 Pascal 伪 码 。 本 书 中 所 用 的 伪 码 和 Pascal 语 言 比较 类 似 。 给 出 的 算法 通常 作为 系统 进程 
的 局 部 算法 ， 系 统 名 字 用 作 程 序 中 变量 的 下 标 。 进 程 名 可 被 用 作 数 组 下 标 ， 也 可 使 用 集合 变 
量 。 变 量 Neig 必 表示 与 p 相 连 的 进程 的 集合 (p 的 近邻 )。 

赋值 语句 (“a := expression” )， 条 件 语句 (“if condition then statement”， 还 可 以 包括 
“else statement” 部 分 )， 循 环 语句 (“while condition do statement” ) 和 Pascal 中 对 应 的 语句 意 
义 相 同 。forall 语 句 具 有 形式 “forall x E€ X do statement”， 在 这 里 x 表示 形 参 ，X 表 示 和 集合， 这 
条 语句 的 含义 是 : 对 于 集合 X 中 每 个 元 素 x， 依 次 执行 statement 语 句 。 在 上 面 的 语句 中 未 确定 X 
集合 中 元 素 的 执行 次 序 ， 但 是 这 条 语句 只 能 用 在 次 序 不 重要 的 地 方 。 例 如 ， 从 p 的 每 个 近邻 接 
收 的 消息 数 必须 初始 化 为 0， 我 们 可 以 写 做 : 

forall q E Neigh, do R,[q]:=0 


在 所 有 情况 下 ， 没 有 使 用 一 条 语句 一 个 分 号 分 隔 的 语句 列表 ， 而 是 将 语句 列表 放 在 
begin 和 end 之 间 。 语 句 中 的 行 分 隔 和 缩 近 本 身 没 有 特殊 的 意义 ， 只 是 为 了 反映 程序 的 分 块 结 
构 。 

消息 传递 。 伪 码 中 常用 “发 送 ” 操 作 和 “接受 ”操作 来 描述 消息 传递 。 消 息 包括 消息 类 
型 、0 或 更 多 “具有 特定 类 型 ”的 数据 域 。 例 如 ， 假 设 每 个 进程 要 将 自己 的 进程 标识 (进程 名 ) 
和 度 (近邻 数 ) 发 送 给 它 的 近邻 ， 为 此 ，info 类 型 的 消息 要 用 两 个 数据 域 ， 即 进程 标识 和 发 送 
方 的 度 。 这 条 消息 表示 为 <info，a，b>。 

发 送 操作 中 必须 确定 要 发 送 的 消息 (包括 消息 的 类 型 和 数据 域 的 值 ) 和 它 的 目的 地 (发 
送 方 的 近邻 是 哪 一 个 )。 数 据 域 的 值 是 一 个 能 够 由 发 送 方 求 值 的 表达 式 。 进 程 p 为 了 向 进程 q 发 
送 它 的 进程 标识 和 度 ， 可 能 执行 下 面 的 操作 : 


send <info, id,, INeigh,l>tog 


简化 符号 “shout” 用 于 向 所 有 的 近邻 发 送信 息 ， 即 ， 语句“shout<info， id,, | Neigh, |>” 
可 理解 成 : 


forall q E Neigh, do send <info, id,, | Neigh, l> to q 


接收 信息 时 ， 不 但 消息 类 型 ， 而 且 消 息 数据 域 的 形 参 和 消息 的 发 送 方 也 要 确定 。 接 收 一 
条 与 近邻 节点 标识 和 度 有 关 的 信息 ， 进 程 p 可 以 执行 如 下 的 操作 : 


receive <info, a, b> from q 
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这 个 操作 删除 通信 系统 中 一 条 类 型 为 info 的 消息 。 这 次 操作 后 ， 该 消息 的 第 一 、 第 二 个 数 
据 域 ， 以 及 发 送 方 分 别 是 a，b，gq。 用 这 种 形式 ， 接 收 操作 不 能 确定 必须 从 哪 一 个 近邻 节点 接 
收 消息 ， 但 在 接收 操作 之 后 ， 所 接收 的 消息 的 发 送 方 变 成 已 知 。 

如 果 进 程 要 从 一 个 特定 的 进程 ， 如 ，go 接 收 消 息 ， 可 以 执行 如 下 的 操作 

receive <info, a, b> fromthis go 

有 时 我 们 可 能 要 表示 : 会 接收 到 不 同类 型 的 消息 ， 并 且 随 后 的 行为 取决 于 实际 接收 到 的 
消息 的 类 型 。 这 可 以 表示 为 (例如 ， 在 图 7-7 所 示 的 算法 和 图 7-9 所 示 的 算法 中 ): 

receive m from q; (*or: fromthis q *) 

if m is <info, a, b> then statement else statement 

p 所 使 用 的 参数 9 是 用 来 描述 p 的 近邻 ， 达 到 发 送 /接收 称 为 近邻 地 址 的 消息 。 在 直接 定 址 
(direct addressing) 的 情况 下 ， 地 址 与 进程 g 的 标识 相等 ; 这 表明 进程 4 的 所 有 近邻 利用 a 的 同 
一 个 地 址 。 在 间接 定 址 (indirect addressing) 的 情况 下 ， 地 址 为 到 进程 p 的 局 部 名 (信道 
名 ) ; 这 种 情况 下 ， 进 程 g 的 近邻 可 以 使 用 4 的 不 同 地 址 ， 如 图 2-5 所 示 。 


var recp|q] for each q € Neigh, : boolean init false ; 


begin while #{q : rec,(q] is false} > 1 do 
begin receive (tok) from q ; recp[q] := true end ; 
send (tok) to qo with rec,[qo] is false ; 
receive (tok) from go ; recp[go] := true ; 
decide 
end 





附录 A-1 面向 控制 表示 法 ( 树 算法 ) 


进程 间 的 通信 可 以 是 异步 方式 ， 也 可 以 是 同步 方式 ( 见 2.1 节 )。 如 果 采 用 异步 方式 (如果 
不 另行 规定 ， 总 是 假设 采用 这 种 方式 ) 进行 通信 ， 发 送 操作 总 是 能 立即 被 执行 。 在 被 执行 相 
应 的 接收 操作 来 删除 之 前 ， 消 息 一 直 存 储 在 通信 子 系统 中 。 在 某 一 确定 类 型 的 消息 可 被 接收 
之 前 ， 接 收 操作 将 执行 进程 挂 起 。 如 果 采 用 同步 方式 进行 通信 ， 不 会 临时 存储 消息 。 在 这 种 
情况 下 ， 发 送 和 接收 操作 都 将 执行 进程 挂 起 ， 这 是 因为 发 送 操作 和 相应 的 接收 操作 的 执行 是 
同步 的 。 在 两 个 进程 都 准备 就 绪 即将 运行 之 前 ， 无 论 是 发 送 进程 还 是 接收 进程 中 哪 一 个 首先 
开始 操作 ， 都 会 被 挂 起 。 接 着 消息 交换 发 生 ， 两 个 进程 继续 执行 各 自 的 算法 。 

面向 控制 表示 法 和 事件 驱动 表示 法 。 算 法 的 总 体 控 制 结构 可 以 用 两 种 方式 来 表示 ， 即 ， 
明确 地 以 面向 控制 (control-oriented) 的 描述 法 ,或 是 隐 含 地 以 事件 驱动 (event-driven) W 
述 法 。 在 算法 中 可 以 任意 选用 两 种 结构 之 一 ， 但 是 在 很 多 情况 下 ， 两 种 描述 方法 中 ， 一 种 比 
另 一 种 更 方便 。 

一 个 算法 的 面向 控制 表示 法 包括 变量 的 声明 ，begin 和 end 之 间 所 包括 的 以 分 号 隔 开 的 一 
系列 语句 。 在 这 种 情况 下 ， 局 部 算法 的 执行 由 这 个 语句 列表 中 的 单个 执行 组 成 。 变 量 可 以 在 
语句 列表 的 开始 被 初始 化 ， 我 们 也 可 以 在 声明 该 变量 的 时 候 给 它 赋 初 值 。 

作为 例子 ， 考 虚 树 附录 A-1 的 算法 。 它 是 树 算法 (图 6-3 所 示 的 算法 ) 的 一 个 面向 控制 表 
示 法 。 由 于 语句 列表 描述 了 局 部 算法 的 整个 控制 流 、 非 确定 性 必须 在 程序 中 明确 指明 。 在 附 
录 A-1 的 算法 的 接收 语句 中 存在 非 确定 性 ， 因 为 没有 相应 的 发 送 语句 被 明确 指明 。 很 难 在 发 送 





HRA BRERA BE 347 





和 接收 消息 之 间 做 出 非 确 定性 选择 ， 但 是 如 果 接 收 信道 能 检测 消息 的 可 用 性 ， 那 么 这 个 问题 
可 以 得 到 解决 。 





var recp|q] for each q € Neigh, : boolean init false ; 
sent, decp : boolean init false ; 


R,: { A message (tok) has arrived } 
begin receive (tok) from g ; recp(q| := true end 


Sp: { #{q : rec,|q] is false} = 1 and sent, = false } 
begin send (tok) to go with T€Cp(Qo] is false ; 
sent, := true 
end 


Dp: { #{q : recp|q] is false} = 0 and dec = false } 
begin decide ; dec, := true end 





附录 A-2 事件 驱动 表示 法 〈 树 算法 ) 


if a message <info, a, b> is available on channel q 
then begin receive <info, a, b>; ... end 
else begin send ...end 


用 算法 的 事件 驱动 表示 方法 更 容易 表示 非 确定 性 (因为 它 是 隐 式 的 )。 这 种 表示 法 包括 变 
量 的 声明 以 及 这 些 变量 的 初始 化 ， 以 及 紧 接着 的 一 系列 行为 。 每 个 行为 由 布尔 表达 式 (行为 
WH. guard) 和 一 条 语句 (行为 体 ，body) 组 成 。 一 个 行为 是 可 行 的 (或 是 可 应 用 的 ) 仅 当 
行为 阔 的 值 为 真 。 行 为 体 可 以 被 以 任何 次 序 执行 任意 次 ， 但 是 仅 当 行为 是 可 行 的 ， 才 被 选择 
执行 。 

附录 A-2 的 算法 是 同一 树 算法 事件 驱动 表示 法 的 一 个 例子 。 因 为 每 条 语句 都 能 被 选择 执行 
任意 次 〈 假 定 行为 盖 值 为 真 )， 必 须 显 式 地 进行 编程 ,使 得 发 送 操 作 和 判定 操作 仅 被 执行 一 次 。 
在 附录 A-2 的 算法 使 用 sent 和 deco 标 志 位 来 做 到 这 些 。 

我 们 没有 做 出 与 事件 驱动 程序 执行 相关 的 公平 性 假设 ; 执行 模型 没有 要 求 ， 一 个 无 限 长 
时 间 可 行 的 行为 最 终 要 被 执行 。 因 此 ， 程 序 员 有 责任 确保 没有 实质 性 行为 会 遭受 饥饿 (因为 
程序 的 其 他 行为 总 是 被 选择 ， 而 它 从 未 被 选择 过 )。 





附录 B 图 和 网 络 


因为 分 布 式 系统 的 拓扑 结构 通常 用 图 来 表示 ， 所 以 图 论 知识 及 其 一 些 术 语 对 于 学 习 分 布 
式 算 靶 是 很 有 帮助 的 。 而 且 ， 分 布 式 算法 的 证 明和 数学 论证 有 时 也 要 用 到 图 (参见 8.2 节 )。 
B.1 节 介绍 了 一 些 常用 的 定义 和 术语 ，B.2 节 论述 了 几 类 特定 的 图 。 


B.1 定义 和 术语 


可 以 认为 图 是 点 〈 称 为 图 的 节点 ) 的 集合 ， 其 中 一 些 点 由 线 ( 称 为 边 ) 连接 ， 参 见 附 录 
B-1。 在 有 向 图 中 ， 边 是 有 方向 的 ， 用 箭头 表示 ; 在 加 权 图 中 ， 丘 予 每 条 边 一 个 数值 。 


(a) (b) 


附录 B-1 (a) 无 向 图 ，(b) 有 向 图 ，(c) 加 权 图 





B.1.1 无 向 图 


无 向 图 G 是 一 个 二 元 组 G = (V, E), RH: V 称 为 G 的 节点 集合 ; E 是 V 中 的 无 序 二 元 组 集 ， 
即 ，E 中 元 素 为 二 元 组 {xu，v}， 其 中 ，u，v E V， 可 简写 成 wv E E， 而 不 是 {u,v} E E。 因 为 
此 二 元 组 是 无 序 的 ， 所 以 uv © E 等 价 于 vu E E。 边 wv 称 为 x (Av) 的 依附 边 。 如 果 uv EE， 就 
称 节 点 z 和 * 是 相 邻 的 ， 或 者 称 为 近邻 。 节 点 的 度 定义 为 依附 它 的 边 数 ， 或 者 是 它 的 近邻 的 数 
目 。 如 果 所 有 节点 都 有 相同 的 度 (5)， 则 称 该 图 为 正则 的 。 

节点 vo 和 vi 之 间 的 长 度 为 k 的 路 径 是 节点 的 一 个 序列 P = <vo。，...，w>， 其 中 ， 对 于 每 一 个 
< 大， 满足 wa E BE。 在 这 条 路 径 上 ，w 为 起 点 ，w 为 终点 。 回 路 是 一 条 起 点 等 于 终点 的 路 径 。 
如 果 一 条 路 径 中 从 vo 到 vi 的 所 有 节点 都 是 不 同 的 ， 则 称 该 路 径 是 简单 的 。 如 果 一 条 回路 中 从 vo 
到 w 的 所 有 节点 都 是 不 同 的 ， 则 称 该 回路 是 简单 的 。 

u 和 v 之 间 的 距离 定义 为 x 和 v 之 间 最 短路 径 的 长 度 ， 记 为 4(n，v)。 图 G 的 直径 为 图 中 任意 
两 个 节点 之 间 的 最 大 距离 。 如 果 一 个 无 向 图 中 任意 两 个 节点 间 都 存在 一 条 路 径 ， 则 称 该 无 向 
图 是 连通 的 。 如 果 一 个 无 向 图 中 不 包含 长 度 大 于 等 于 3 的 简单 回路 ， 则 称 该 无 向 图 是 无 环 的 。 

一 个 图 C = (V，E')， 如 果 V' CV，E' CE， 则 称 其 为 G 的 子 图 (subgraph)。 如 果 V' = V, 
则 称 G' 为 生成 子 图 。 如 果 E' = {uve El uEV'Av EV'}， 则 称 G' 为 导出 子 图 。 G 的 连通 分 量 
(connected component) 是 G 的 最 大 连通 导出 子 图 G'， 即 ，G' 是 一 个 连通 的 导出 子 图 ， 但 如 果 
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增加 节点 来 扩展 V'， 它 的 导出 子 图 就 不 连通 了。 连通 分 量 形 成 了 图 的 一 个 划分 ， 当 且 仅 当 整 
个 图 连通 时 ， 划 分 是 由 一 个 分 量 组 成 的 。 

如 果 一 个 图 可 以 画 在 一 个 平面 上 ， 而 不 存在 交叉 边 ， 则 该 图 称 为 平面 图 。 如 果 一 个 图 可 
以 画 在 一 个 平面 上 ， 而 不 存在 交叉 边 ， 且 所 有 节点 都 在 图 形 边 缘 ， 则 该 图 称 为 外 平面 图 
(outerplanar)。 下 面 是 平面 图 和 外 平面 图 的 一 些 比较 重要 的 性 质 : 

(1) N 个 节点 的 平面 图 至 多 有 3N-6 条 边 。 

(2) 一 个 平面 图 至 少 有 一 个 度 不 大 于 5 的 节点 。 

(3) 一 个 外 平面 图 至 少 有 一 个 度 不 大 于 2 的 节点 。 


B.1.2 有 向 图 


一 个 有 疝 图 G 是 一 个 二 元 组 G = (V, E), Hp: V 称 为 节点 集合 ; E 是 V 中 元 素 的 有 序 二 
元 组 的 集合 ， 即 ，E 中 元 素 为 数 对 (u,v)， 其 中 ,u,v E V。 可 简写 成 uv CE, 而 不 是 (u, 
v)E E。 因 为 此 二 元 组 是 有 序 的 ， 所 以 uv E€ E 不 等 价 于 vu E E。 无 向 图 的 大 多 数 定义 稍 做 修改 
就 变 成 了 有 向 图 的 定义 。 

边 uwv 称 为 4 的 出 边 ，v 的 入 边 ， 如 果 uv E E，u 称 为 v 的 出 近邻 (out-neighbor)，v 称 为 4 的 入 
近邻 (in-neighbor)。 节 点 的 入 度 (in-degree) 为 其 进入 边 的 数目 ， 出 度 (out-degree) HHH 
出 边 的 数目 ， 度 为 人 人 度 与 出 度 之 和 。 ， 

节点 wo 和 vi 之 间 的 长 度 为 的 路 径 ， 为 节点 序列 P = <vo, o v>, AH, HFE Ni <k, 
满足 vvi,! E E。 在 这 条 路 径 上 ，、vo 为 起 点 ，vi 为 终点 。 回 路 (cycle) 是 一 个 起 点 等 于 终点 的 路 
径 。 和 无 向 图 一 样 ， 如 果 一 条 路 径 中 从 vo 到 vi 的 所 有 节点 都 是 不 同 的 ， 则 称 该 路 径 是 简单 的 。 
如 果 一 条 回路 中 从 m 到 w 的 所 有 节点 都 是 不 同 的 ， 则 称 该 回路 是 简单 的 。 

从 4 到 v 之 间 的 距离 定义 为 x 和 v 之 间 最 短路 径 的 长 度 ， 记 为 4d(u，v)。 图 G 的 直径 为 图 中 任 
意 两 个 节点 间 的 最 大 距离 。 如 果 一 个 有 向 图 中 任意 两 个 节点 间 都 存在 一 条 路 径 ， 则 称 该 有 向 
图 为 强 连 通 的 。 如 果 一 个 有 向 图 中 不 包含 长 度 不 小 于 2 的 简单 回路 ， 则 称 访 有 向 图 为 无 环 的 。 

有 向 图 中 ， 子 图 、 生 成 子 图 和 导出 子 图 的 定义 与 无 向 图 相同 。 


B.1.3 带 权 图 


一 个 (有 向 或 无 向 ) 图 ， 如 果 对 于 每 个 4v © E 的 二 元 组 ，x，v， 都 定义 一 个 数值 w,,， 则 
称 该 图 是 带 权 的 (weighted)。 如 果 对 于 每 个 二 元 组 ，w,, = ww， 则 称 权 值 赋值 是 对 称 的 。 在 
带 权 图 中 ， 路 径 的 权 值 定义 为 路 径 上 所 有 边 的 权 值 总 和 。 

如 果 假 设 一 个 图 没有 赋 给 权 值 ， 则 称 其 为 不 带 权 的 (unweighted). 


B.2 常用 


本 市 定 义 和 讨 论 几 类 在 分 布 式 算法 研究 中 经 常 遇 到 的 图 ， 即 ， 环 、 树 、 森 林 、 网 格 、 贺 
环 、 团 和 超 立 方 体 。 正 如 从 本 书 中 很 多 结果 可 以 证 明 的 ,分布 式 系 统 中 的 计算 在 具有 受 限 拓 
扑 结构 的 网 络 上 ， 能 够 比 在 任意 (但 不 连通 ) 拓扑 网 络 上 更 有 效 地 进行 。 

最 终 ， 设 存在 图 G = (V, E), NASA, DARAB. 
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B.2.1 环 


环 拓 扑 是 节点 的 一 个 圆 形 排列 ， 经 常用 于 分 布 式 计 算 的 控制 拓扑 。 一 些 网 络 〈 如 ， 令 牌 
环 网 [Tan96，4.3 节 ]) 将 节点 按 环形 进行 物理 排列 ， 但 在 其 他 情况 下 ， 环 主要 用 作 骸 人 控制 结 
构 。 为 了 以 循环 方式 给 每 个 进程 它 的 轮 次 (执行 某 些 功 能 )， 进 程 在 它们 之 间 循 环 传递 消息 ， 
vo 发 送 消 息 到 v1， 然 后 v1 到 v,， 等 等 ， 直 到 vw_;，vw-1 再 将 消息 发 送 到 vo。 

定义 B.1 环 是 一 个 无 向 、 连 通 且 度 为 2 的 正则 图 。 

环 的 可 以 用 几 种 方式 来 表述 特征 。 

定理 B.2 对 于 一 个 无 向 图 G， 以 下 是 等 价 的 : 

(1) G 是 一 个 环 ， 

(2) 从 V 到 {0，...，N--1} 存 在 一 对 一 映射 ， 满 足 节 点 i 的 近邻 为 节点 i-1 和 i +1 (mod N). 

为 了 在 其 他 网 络 拓扑 中 利用 环 拓 扑 的 优点 ， 有 时 一 个 生成 环 可 以 被 定义 为 -- 个 图 G = (V, 
E)， 也 就 是 说 ， 选 择 一 个 集合 E'CE， 满足 (V, E) 为 一 个 环 。 但 是 ， 令 人 遗憾 的 是 ， 并 不 
是 每 个 图 都 包含 一 个 生成 环 〈 哈 密 尔 顿 回 路 (Hamiltonian cycle ) ) ， 判 定 一 个 给 定 图 是 否 包含 
生成 环 是 一 个 NP- 完 全 问题 [GJ79]。 然 而 ， 可 以 定义 一 个 虚拟 环 (virtual ring )， 在 这 种 情况 
下 ， 环 中 连续 节点 在 原 图 中 不 必 是 近邻 。Bakker 和 Van leeuwen[BL93] 描 述 了 一 个 构造 虚拟 环 
的 分 布 式 算法 ， 其 中 环 的 连续 节点 间 的 距离 至 多 为 3。 


B.2.2 树 、 森 林 和 星 


树 是 一 个 包含 最 少 的 连接 其 所 有 节点 的 边 的 图 ( 见 定理 B.4)， 所 以 ， 树 形 网 络 上 的 计算 
可 以 有 非常 低 的 通信 复杂 度 。 对 于 分 散 式 计 算 ， 造 成 对 树 的 计算 的 复杂 度 低 的 另 一 个 因素 是 
存在 一 个 针对 树 的 有 效 分 散 波动 算法 (图 6-3 所 示 的 算法 ) 。 

定义 B.3 树 是 一 个 无 向 、 连 通 的 无 环 图 。 

可 以 用 下 列 方法 描述 树 的 特点 [CLR90]。 

定理 B.4 对 于 一 个 无 向 图 G， 以 下 是 等 价 的 : 

(1) G 是 一 棵 树 。 

(2) 任意 两 节点 间 存 在 惟一 一 条 简单 路 径 。 

(3) G 是 连通 的 ， 的 。 

(4) G 是 连通 的 ， 且 IE| = 

(5) G 是 无 环 的 ， 且 IEL= N-1。 

(6) G 是 无 环 的 ， MEERN ORLRRANKH. 

一 棵 树 7 = (V，E)， 如 果 存 在 惟一 指定 的 根 节点 r+， 则 称 该 树 是 有 根 的 。 如 果 u 是 v 和 7 之 
间 的 (惟一 ) 简单 路 径 上 的 节点 ， 则 zu 称 为 v 的 祖先 ，v 称 为 4 的 后 代 。 如 果 u 和 v 是 近邻 ，v 称 为 
4 的 子 节点 ，u 称 为 v 的 艾 节点 。u 的 后 代 所 导出 的 子 图 是 一 棵 有 根 树 ( 根 为 x) ， 称 为 的 子 树 。 
树 的 深度 定义 为 从 根 到 任 一 节点 的 最 大 简单 路 径 长 度 。 

每 个 连通 图 G = (V, E) 都 包含 一 棵 生成 树 ， 即 ， 选 择 一 个 集合 E' CE, 满足 (V, E') 
是 一 棵 树 ， 而 且 ， 如 果 G 本 身 不 是 一 棵 树 ， 可 以 按 不 同方 法 选择 生成 树 。E' 中 的 边 称 为 树 边 ， 
E\E' 中 的 边 称 为 非 树 边 。 
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下 面 是 几 类 在 分 布 式 计算 中 比较 重要 的 生成 树 : 

(1) 小 直径 生成 树 ”如 果 必 须 选择 生成 树 来 最 小 化 计算 它 所 必须 的 总 的 上 时间、 那么 就 希 
望 其 直径 尽 可 能 小 。 定 理 4.2 证 明 中 构造 的 最 优 汇集 树 的 直径 至 多 是 整个 网 络 直 径 的 2 倍 ， 可 
以 用 第 4 章 和 12.4 节 描述 的 算法 进行 构造 。 

(2) 最 小 加 权 生 成 树 ” 生 成 树 中 边 的 数目 总 是 等 于 N-1 (参见 定理 B.4 (4))， 但 在 加 权 图 
中 ， 树 的 权 值 〈 树 中 每 条 边 的 权 值 的 和 ) 通常 对 于 每 个 可 能 的 生成 树 并 不 相同 。 如 果 一 个 生 
成 树 计 算 的 总 通信 成 本 必须 很 低 ， 则 必须 选择 子 树 以 使 树 的 权 值 最 小 。 如 果 所 有 边 权 值 都 不 
闻 ， 则 最 小 加 权 生 成 树 是 惟一 的 《命题 7.18 ) 。 计 算 这 种 惟一 的 树 的 分 布 式 算法 由 Gallager 等 
人 [GHS83] 给 出 ， 并 在 7.3.2 节 进行 了 讨论 。 

(3) 度 受 限 的 生成 树 ”如 果 每 个 节点 的 计算 开销 必须 很 小 ， 则 必须 选择 节点 的 度 较 小 的 
生成 树 。 这 种 树 的 分 布 式 构 造 算法 由 Korach 等 人 {IKMZ85] 给 出 。 

(4) 深度 优先 搜索 树 ”如 果 一 棵 生成 树 的 每 条 非 树 边 都 连接 一 个 节点 和 该 节点 的 一 个 后 
代 ， 则 称 其 为 深度 优先 搜索 树 。 深 度 优先 搜索 树 用 于 很 多 对 图 操作 的 算法 中 ， 例 如 ， 检 测 平 
面 性 或 双 连 通 性 的 算法 ， 也 用 于 压缩 路 由 的 区 间 标 号 模式 的 构造 算法 ， 参 见 4.4.2 节 。 构 造 深 
度 优先 搜索 树 的 分 布 式 算法 在 6.4 节 给 出 。 

森林 是 对 树 的 推广 ， 星 是 特殊 类 型 的 树 。 由 -一些 孤立 树 组 成 的 图 称 为 森林 。 

定义 B.5 森林 是 无 向 无 环 图 。 

定理 B.6 对 于 一 个 无 向 图 G， 以 下 是 等 价 的 : 

(1) G 是 一 个 森林 ; 

(2) 任何 两 个 节点 间 至 多 存在 一 条 简单 路 径 ; 

(3) G 的 每 个 连通 分 重 都 是 一 棵 树 ; 

(4) 如 果 删 除 任意 一 条 边 ，G 的 连通 分 量 的 数目 就 减 小 1; 

(5) G 的 连通 分 量 的 数目 等 于 IVI-IEl。 

如 果 森 林 的 每 棵 树 都 指定 一 个 根 节点 ， 则 称 该 森林 是 有 根 的 ， 每 个 图 都 有 -个 生成 森林 ， 
由 图 的 每 个 连通 分 量 的 生成 树 组 成 。 

星 是 一 个 带 有 中 心 的 图 ， 所 有 其 他 节点 都 只 和 中 心 相连 接 。 

定义 B.7 星 是 一 个 深度 为 1 的 有 根 树 ， 星 的 根 称 为 中 心 。 

星 并 不 是 一 种 常用 的 分 布 式 系统 的 物理 连接 拓扑 ， 而 是 在 由 中 心 进程 控制 的 计算 中 用 作 
虚拟 拓扑 。 在 这 种 计算 中 ， 所 有 进程 只 与 中 心 节 点 通信 ， 也 就 是 说 只 使 用 整个 网 络 中 为 星 的 
(生成 ) 子 图 ， 见 图 6-6 所 示 的 算法 。 

定理 B.8 对 于 一 个 无 向 图 G， 以 下 是 等 价 的 : 

(1) G 是 一 个 星 ; 

(2) G 是 连通 的 ， 至 多 包含 一 个 度 大 于 1 的 节点 。 


B.2.3 
图 ， 又 称 为 完全 图 ， 其 中 每 两 个 节点 间 都 由 一 条 边 直 接 相 连 。 
定义 B.9 团 是 直径 为 1 的 图 。 


和 星 一 样 ， 团 很 少 用 作物 理 连接 拓扑 ， 之 所 以 这 样 是 因为 图 中 边 的 数目 大 ， 需 要 大 量 的 
硬件 。 在 大 部 分 网 络 中 ， 并 不 是 每 对 节点 都 直接 相连 ， 不 连通 的 节点 间 的 通信 需要 这 些 节 点 
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间 的 路 径 上 的 所 有 节点 共同 参与 。 但 是 ， 如 果 这 种 参与 在 系统 较 低 层 上 不 可 见地 实现 ， 则 网 
络 在 较 高 层 上 可 以 被 认为 是 团 。 

定理 B.10 ”对 于 一 个 无 向 图 G， 以 下 是 等 价 的 : 

(1) G 是 一 个 团 ; 

(2) E={uv: u, vEV, u + v}; 

(3) IEl= (1/2)N (N-1) ; 

(4) 每 个 节点 的 度 为 N-1。 


B.2.4 网 格 和 圆 环 


一 个 xm 的 网 格 ， 有 N = 天 个 节点 ， 排 列 成 m 行 ， 每 行 有 "个 节点 ， 每 个 节点 和 它 上 、 下 、 
左 、 布 的 节点 相连 ， 见 附录 B-2。a xn 的 圆 环 (torus) 与 网 格 相似 ， 但 除了 每 行 最 左边 和 最 右 
边 的 节点 是 相连 的 ， 每 列 最 上 边 和 最 下 边 的 节点 是 相连 的 ， 见 图 附录 B-2。 网 格 和 圆 环 是 设计 
多 处 理 器 计算 机 时 最 常用 的 拓扑 ， 因 为 每 个 节点 的 度 至 多 为 4， 可 以 在 Transputer 芯 片上 物理 
地 实现 这 些 拓 扑 。 这 种 拓扑 结构 非常 适合 进行 矩阵 计算 。 





附录 B-2 网 格 和 圆 环 

为 了 对 这 些 拓扑 进行 形式 定义 ， 记 Z, 为 模 * 的 整数 的 集合 。 

定义 B.11 nxn 网 格 是 一 个 有 N = m? 个 节点 的 图 ， 每 个 节点 都 可 以 用 { (i, 让: 0 < i, J 
< 全 中 的 元 素 疏 一 地 标号 ， 用 这 种 方法 ， 即 ， 节 点 (G, j) 和 (i, j) SH, SERS 
Gsi) A G=j+1), & G=i) A G=j-1), 或 (i=i41) A (=j), 或 (i=i-1) 
A (i=/'). 

中 xP 国 环 是 一 个 有 N = 呈 个 节点 的 图 ， 每 个 节点 都 可 以 用 { (i,j): i, FEZ POLE 
一 地 标号 ， 用 这 样 一 种 方法 ， 即 ， 节 点 (i, j) 和 (i'， j) RH, SERS (isi) 
A G=j+1), A (i=i') A G=j-1), 或 人 =) A (j= 站 ), 或 (i=i-1) A (Gi=J'). 
(3k E iZ M2 RN) 

?xm 了 网 格 有 2nm(a-1) 条 边 ， 包 含 度 为 2、3 和 4 的 节点 ， 它 的 直径 为 20x-1)。 nx nl HA 2n? 
条 边 ， 每 个 节点 的 度 为 4， 具 有 正则 性 ， 直 径 为 21n/2]。 


B.2.5 超 立 方 体 


与 网 格 和 圆 环 类 似 ， 超 立方 体 多 用 来 设计 多 处 理 器 计算 机 。 它 们 结合 了 合理 小 的 直径 和 
合理 小 的 度 ， 直 径 和 度 都 等 于 logN， 这 里 N 为 节点 数 。Saad 和 Schultz[SS88] 研 究 了 这 类 图 的 拓 
扑 性 质 。 
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定义 B.12 n- 维 超 立 方 体 是 一 个 有 N= 2" 个 节点 的 图 , 每 个 节点 都 可 以 赋 给 集合 { (dy, e bet)! 
b;=0，1} 中 的 一 个 惟一 元 素 ， 用 这 样 一 种 方法 ， 即 ，E= {uv: u 和 Vv 的 标号 只 有 一 位 不 同 }。 





附录 B-3 1，2，3 和 4 维 超 立方 体 


超 立方 体 是 度 为 的 正则 图 ， 直 径 为 +。 可 以 从 不 同 的 角度 观察 超 立方 体 ， 一 些 有 趣 的 图 
论 结果 可 参见 [SS88]。 首 先 ， 定 义 B.12 中 的 谈 及 的 标号 远 不 止 一 种 ， 如 果 G 是 一 个 n 维 超 立方 
体 ， 则 有 2"mn! 种 这 类 标号 。 l 

可 以 通过 取 两 个 a 维 超 立方 体 并 连接 对 应 的 节点 来 构造 (z+1)- 维 超 立方 体 ， 在 附录 B_3 
中 ， 对 应 节点 间 的 边 用 虚线 表示 。 

如 果 固定 一 个 超 立方 体 的 节点 的 一 个 标号 ,不 难 证 明 下 面 的 结论 ， 如 果 u 和 v 是 相 邻 的 ， 
则 u 的 近邻 和 v 的 近邻 以 一 对 一 的 方式 连接 ， 也 就 是 说 ，v 的 每 个 近邻 都 只 和 wu 的 一 个 近邻 相 邻 ， 
反之 亦 然 。 但 是 比较 困难 的 是 证 明 ，( 利 用 一 些 附 加 的 ， 相 当 平凡 的 条 件 )， 相 邻 节点 的 近邻 
之 间 的 一 对 一 连接 是 否 足 以 使 一 个 图 成 为 一 个 超 立 方 体 。 

定理 B.13 对 于 一 个 无 向 图 G， 以 下 是 等 价 的 : 

(1) G 是 一 个 n 维 超 立 方 体 ; 

(2) N = 2"，G 是 正则 的 ， 度 为 4，G 是 连通 的 ， 对 于 每 对 相 急 节点 4，v， 它 们 的 近邻 者 以 
一 对 一 的 方式 连接 。 

总 结 。 附 录 B-4 总 结 了 本 节 讨 论 的 各 类 图 的 主要 特点 。 


网 格 (nxn) 
AA (nxn) 


超 立 方 体 (n 维 ) 





附录 B-4 各 类 图 
B.3 方向 侦 听 


Santoro[San84] 发 现 ， 分 布 式 计算 的 通信 复杂 度 除 了 受 实际 拓扑 的 影响 外 ， 还 受 以 下 因素 
影响 : 
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(1) 拓扑 意识 : 为 了 利用 某 种 特定 拓扑 的 优点 ， 有 时 进程 需要 “知道 ”它们 被 连接 到 哪 
种 拓扑 中 。 例 如 ， 选 择 问题 (第 7 章 ) 可 以 用 团 网 络 解决 ， 只 需 O(NiogM 条 消息 。 然 而 ， 如 果 
在 团 中 采用 任意 连接 网 络 的 最 优 算法 ， 要 交换 Q(N) 条 消息 。 因 此 ， 为 了 利用 全 连接 的 优点 ， 
进程 必须 知道 它们 处 于 团 中 。 

(2) 方向 侦 听 : 如 果 依 附 于 每 个 节点 的 边 都 用 它们 在 网 络 中 所 指 的 “方向 ”进行 标号 ， 
. 则 网 络 中 信息 的 路 由 就 会 更 加 有 效率 。 有 了 这 种 信息 ， 对 于 那些 只 知道 存在 长 路 径 的 节点 ， 
我 们 可 以 找到 更 短 (通常 是 最 优 的 ) 路 径 通 向 它 。 

附录 B-5 描 述 了 网 格 网 络 的 一 部 分 ， 从 中 可 以 看 出 方向 侦 昕 的 优点 。 节 点 v 已 经 发 出 了 对 
某 些 资 源 的 请 求 ， 该 请 求 被 几 个 节点 转发 (这 些 节点 没有 所 请 求 的 资源 )， 最 后 到 达 拥有 资源 
的 x， 因 为 u 发 现 请 求 信息 已 经 向 右 转发 3 次 ， 向 下 2 次 ， 向 左 3 次 ， 于 是 4 向 上 传送 应 答 。 应 答 
被 通过 长 度 为 2 的 路 径 发 送 ， 而 不 是 沿 着 请 求 信息 经 过 的 路 径 (8 条 边 ) 向 回转 发 。 显 然 ， 只 
有 节点 “知道 ”它们 的 每 条 依附 边 所 指 的 方向 ， 才 能 发 现 一 个 更 短 的 返回 路 径 。 





附录 B-5 探索 方向 侦 听 


当然 ， 对 于 一 个 图 ， 拓 扑 不 同 ,“ 方 向 ”的 意义 也 不 同 。 在 这 种 情况 下 ， 假 设 对 于 每 个 节 
点 ， 那 个 节点 的 边 都 标 以 对 于 该 类 图 “有 意义 的 方向 "。 如 果 $ 表 示 标 号 ， 对 于 节点 "中 的 边 om 
可 分 配 的 标号 记 作 S, (x)， 同 样 的 边 在 节点 4 中 ， 则 标号 为 5, (*)。 现 有 标号 的 集合 对 于 每 个 节 
点 来 说 是 相同 的 ， 集合 的 大 小 人 等 于 网 络 的 度 ， 因 为 对 于 每 个 节点 ， 边 的 标号 是 惟一 的 。 为 
了 进行 方向 侦 听 ， 还 必须 验证 另外 一 个 全 局 一 致 性 条 件 。 下 面 分 别针 对 四 种 不 同 的 图 解释 其 
各 自 方 向 侦 听 的 意义 。 

环 : 如 同 度 为 2 的 正则 环 ， 环 上 只 有 两 个 方向 ， 我 们 称 之 为 “Prev”( 前 一 个 ) 和 “Nexrr"。 
如 果 ! 是 "后 的 “Nexr” 节 点 ， 则 "是 x 之 前 的 “Prev” 节 点。 如 果 每 对 相 邻 节点 都 满足 这 种 关系 ， 
则 定向 是 全 局 一 致 的 ， 见 附录 B-6。 


Nezt Prev 
Prev Next 


Prev Next 
规模 为 6 的 环 具有 方向 侦 听 的 环 定向 环 


附录 B-6 环 的 方向 侦 听 
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定义 B.14 环 的 标号 就 是 在 每 个 具有 集合 {Prev，Next} 中 的 不 同 标 号 的 节点 处 ， 对 依附 于 
那个 节点 的 边 赋值 。 如 果 对 于 所 有 的 近邻 节点 u 和 v， 有 
S,(v) = Prev <=>S,(u) = Next 


则 环 上 的 标号 SY RA AMA. 





附录 B-7 团 的 方向 侦 昕 


环 中 的 方向 侦 听 不 是 惟一 的 ， 有 两 种 边 标号 方式 满足 这 些 限 制 。 假 定 环 中 总 存在 方向 俩 
昕 。 显 然 ， 如 果 一 个 节点 通过 它 的 Next 边 发 送 一 个 消息 ， 则 接收 到 该 消息 的 每 个 节点 再 通过 
各 自 的 Next 边 继续 转发 该 消息 ， 在 消息 返回 第 一 个 节点 之 前 ， 所 有 的 节点 都 会 收 到 该 消息 。 
通常 ， 这 是 通信 信道 被 使 用 的 惟一 方向 。 通 常 假设 环 是 有 向 的 ， 如 附录 B-6 所 示 。 

团 : 带 有 WN 个 节点 的 团 的 度 为 N-1， 它 的 方向 被 标号 为 从 1 到 N-1， 即 ，L = {1，.…，N- 
1}。 如 果 通 过 将 边 ww 标 以 《在 wu 中) 沿 着 环 从 u 到 v 的 距离 ， 从 而 确定 一 个 团 中 的 有 向 哈密 尔 顿 
mek (Hamiltonian Cycle )， 则 这 种 标号 就 形成 了 方向 侦 听 。 

定义 B.15: 团 的 标号 就 是 在 每 个 具有 集合 {1，.…， WN-1} 中 的 不 同 标号 的 节点 处 ， 对 依附 
于 那个 节点 的 边 进行 赋值 。 如 果 团 的 节点 可 以 被 标号 为 从 0 到 N-1， 标号 采用 这 样 的 方法 ， 即 ， 
对 于 每 个 i 和 rj, S: (G) =(j-i)mod N， 则 园 上 的 标号 5S 形成 方向 侦 听 。 

附录 B-7 中 表示 的 是 一 个 带 有 方向 侦 听 的 团 。 团 的 方向 侦 听 也 不 是 惟一 的 ， 实 际 上 有 
(N-1) ! 种 不 同 的 标号 方法 可 以 形成 团 的 方向 侦 听 。Loui 等 人 [LMW86] 证 明 ， 如 果 方 向 侦 听 
可 用 ， 团 的 选择 问题 用 O(N) 条 消息 就 可 以 解决 。 

WR: AAW AMR. F AMA, EHU, D, R, L 

定义 B.16 MAGS REABAAARALU. D., R, Z} 中 的 不 同 标 号 的 节点 处 ， 对 依 
附 于 那个 节点 的 边 进行 冉 值 。 如 果 节 点 可 以 按 下 面 方式 用 集合 { (i，j); i，j E Z} 的 元 素 重 
命名 ， 

(1) Suni, j) U= (=i) A (j'=j+) 

(2) Sup (i, 7")) = 也 一 (i' =i) A (j'=j-1) 

(3) Sap (i, 门 ) =L= (i'=i-1) A (也 = 六 

(4) Sun (C's j) =R= (=i) A (j'=j) 

MORE ORS SH RA RF, 

U7 TO ATE HE— AY, ASR > 4， 则 存在 8 种 不 同 的 能 进行 圆 环 方向 侦 听 的 标号 ， 





ARB A fA% 357 


附录 B-8 所 示 就 是 一 个 带 方向 侦 听 的 圆 环 。 

超 立 方 体 : n- 维 超 立 方 体 的 维 数 从 0 到 n-1 进 行 标号 ， 如 果 所 有 平行 边 被 标号 为 相同 的 数 
字 ， 则 存在 一 个 方向 侦 听 。 

定义 B.17 n- 维 超 立 方 体 的 标号 就 是 在 每 个 具有 集合 {0，..…., mn-1} 中 的 不 同 标号 的 节点 处 ， 
对 依附 于 那个 节点 的 边 进行 赋值 。 如 果 节 点 能 用 集合 { (bo，...，bw-1): bi = 0, MARES 
名 ， 并 满足 如 果 标 号 3 (on a bpp) ((co, s C11)) =i, R] (bo, 20, bni) Fe (Co, ..., Cr) 
只 有 第 i 位 不 同 ， 此 时 ， 超 立方 体 的 标号 S 形 成 方向 侦 听 。 

超 立方 体 的 方向 侦 昕 不 是 惟一 的 ， 对 于 n- 维 超 立 方 体 有 n! 种 不 同 的 给 超 立 方 体 方 向 侦 听 
的 边 标 号 。 定 义 表明 对 于 连通 的 节点 u 和 v，5,(v) =S, (wn)， 因 此 ， 附 录 B-9 中 ， 每 条 边 只 有 


一 个 标号 。 























附录 B-9 超 立 方 体 上 的 方向 侦 听 





方向 侦 听 数 给 出 一 致 性 的 定义 


{Prev, Next} 
{J, a. N-I} 

{U, D. L, R} 
{0,....n—1} 


附录 B-10 图 的 方向 侦 听 
附录 B-10 总 结 了 四 类 图 的 方向 侦 听 的 性 质 ，Flocchini et alfFMS98] 给 出 了 方向 侦 听 的 一 般 
定义 及 其 性 质 的 正式 描述 。 对 于 本 节 中 所 描述 的 以 及 其 他 更 多 的 图 ， 方向 侦 听 都 可 以 用 第 11 
章 的 群 的 概念 适当 地 加 以 描述 。 计 算 超 立方 体 和 圆 环 上 的 方向 侦 听 的 分 布 式 算法 参见 [EMS98] 
和 [Tel94]。 





习题 
B.1 节 


B.1 证 明 无 向 图 的 以 下 结果 : 

7 个 节点 的 连通 至 少 有 m-1 条 边 。 

7H 个 节点 的 无 环 图 至 多 有 m~-1 条 边 。 

称 无 向 图 为 二 分 图 (bipartite )， 如 果 图 中 的 节点 可 用 两 种 颜色 ( 红 和 黑 ) 着 色 ， 使 得 相 
RG RMR ME. 

B.2 证 明 无 向 图 为 二 分 图 ， 当 且 仅 当 图 中 不 含 奇数 长 度 的 回路 。 


B.2 节 


B.3 证 明 (1) 规模 为 偶数 的 环 ，(2) 树 ， 和 (3) 超 评 方 体 部 是 二 分 图 。 
B.4 证 明定 理 B.4 和 定理 B.6。( 提 示 : 利用 B.1)。 
B.5 (HA) 定理 B.13 (2) 中 的 四 个 条 件 ， 其 中 任 惠 一 个 可 以 删除 吗 ? 


B.3 节 


B.6 证 明 团 上 只 有 (N~1)1! 种 不 同 的 方向 俩 听 。 

证 明 n- 维 超 立 方 体 团 上 只 有 n! HREM A OA, 

B.7 设 S 总 团 上 的 标号 。 对 于 路 径 P = <vo,… ,WV>， 定 义 Sum(P) = S V+ + Spe 
证 明 以 下 两 种 阐述 等 价 。 

(1) 8 是 方向 侦 听 。 

(2) 对 于 每 条 路 径 P，P 是 回路 ， 当 且 仅 当 Sum(P) =0 (mod N) 
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causality chain (因果 链 ) 57, 185 deadlock ( 死 锁 ) ,158, 351 
centralized algorithm (集中 式 算法 ) , 183,272 decided (判定 的 ) , 438 7 


chain-time complexity ( 链 时 间 复 杂 度 ) , 223 initial (初始 和 的) , 45 





legitimate (合法 的 ) ,521 
livelock ( 话 锁 ) , 174 
of a probabilistic algorithm (概率 算法 ) ,310 
possible ( 可 能 的 ) ,338 
cycle-increase ( 周期 递增 ) , 541 
symmetric (对 称 的 )，317 
synchronous system (同步 系统 ) ,398 
terminal (终止 ) ,45 
univalent (单价 的 ) , 438 
congestion (HÆ) ,8 
connected component (连通 分 量 ) , 557 
connected graph (连通 图 ) , 557 
connection management (连接 管理 ) , 74,90 
consensus ( 一致 性 ) , 432 
consensus algorithm ( -一致 性 算法 ) ,438 
agreement (一 致 ) ,438 
convergence (收敛 性 ) , 452 
dependence (相关 性 ) , 462 
non-triviality ( 非 平凡 性 ) , 438 
termination (终止 ) , 438 
consensus problem (一 致 性 问题 ) , 431 
consistency for decision task (判定 任务 的 一 致 性 ) , 431, 
445 
consistent cut (一 致知) , 339 
consumption of a packet ( 包 消 耗 ) , 157 
control algorithm (控制 算法) , 271 
control message (控制 消息 ) ,271 
control-oriented notation (面向 控制 的 表示 法 ) , 553 
controller (控制 器 ) ,157 
acyclic orientation cover (无 环 有 向 覆盖 ) ,164 
backward-count (后 向 计数 ) , 168 
backward-state (后 向 状态 ) , 170 
buffer-graph (缓冲 图 ) , 159 
deadlock-free (无 死 锁 ) , 158 
destination scheme ( 目的 地 模式 ) , 161 
forward-count (前 向 计数 ) , 167 
forward-state (前 向 状态 ) , 168 
hops-so-far scheme ( 当前 跳 数 模式 ) , 162 
hops-to-go scheme (下 一 跳 数 模式 ) , 163, 177 
livelock-free (无 活 锁 的 ) ,174 
convergence (consensus alg.) (收敛 ,一 致 性 算法 ) ,452 
copy-release deadlock (无 复制 的 死 锁 ) , 173 
crash model ( 损毁 模型 ) , 429 
crash-robust consensus ( 损毁 -健壮 一 和 致 性 ) ,452 
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creation of a message (消息 创建 ) ,67 
credit-recovery algorithm (信用 恢复 算法 ) , 299 
critical section (KRE) , 524 

CSMA/CD (载波 侦 听 多 路 访问 / 神 突 检 测 ) ,24 
cut (AJ) ,338 

consistent (一致 性 ) , 339 

cycle ( 回路) , 557 

cycle-free routing tables (无 回路 路 由 表 ) , 108 
cyclic function (周期 函数 ) ,318 

cyclic interval ( 周期 间隔 ) ,134 

cyclic wait ( 周期 等 待 ) , 11 


data-link layer (数据 链 路 层 ) , 20,75 
deadlock ( 死 锁 ) , 158, 268, 351 
AND model (AND 模 型 ) ,354 
communication deadlock (通信 死 锁 ) ,354 
copy-release (无 复制 的 ) , 173 
OR model (OR 模型 ) ,354 
pacing ( 步 ) ,173 
progeny (后 代 ) ,173 
reassembly ( 重组) , 174 
resource (资源 ) , 354 
store-and-forward (存储 转发 ) , 155 
deadlock detection ( 死 锁 检 测 ) , 11, 346, 349 
deadlock freeness ( 死 锁 自由 度 ) ,52 
debugging (调试 ) , 336 
decentralized algorithm (分 散 式 算法 ) , 183,272 
decided configuration (判定 的 配置 ) ,438 
decision event (判定 事件 ) , 183 
decision graph ( 判定 图 ) ,449 
decision problem (判定 问题 ) , 431 
decision task ( 判定 任务 ) ,445 
degree (BE) , 557 
dependence (相关 性 ) 
for broadcast algorithm (广播 算法 ) ,471 
for consensus algorithm (一 致 性 算法 ) ,462 
for interactive consistency (交互 一 致 性 ) ,492 
depth (深度 ) , 560 
depth-first search (深度 优先 搜索 ) . 209 
Awerbuch’s algorithm (Awerbuch 算 法 ) , 212 
Cidon’s algorithm (Cidon 算 法 ) , 214 
DFS tree (RERRSRRB) , 209, 561 


interval labeling scheme (ILS) (区 间 标 号 模式 ) , 
138 
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Update algorithm ( 出 新 算法 ) , 546 

with sense of direction ( 带 方向 侦 听 ) , 362 
derivate (tH) , 52,72 
descendant (Kift) , 560 
destination (FMW) ,47 
deterministic algorithm (从 定性 算法 ) , 309 
diffusing computation (扩散 计算 ) ,272.276 
digital signature ( 数字 签名 ) ,482 
Dijkstra-Feijen-Van Gasteren algorithm 
( Dijkstra-Feijen-Van Gasteren 7k) , 285 
decision (ila) , 183 
Dijkstra-Scholten algorithm 
(Dijkstra-Scholten 算 法 ) , 276 
direct addressing 《直接 定 址 ) ,69, 553 
directed graph (有 向 图 ) . 558 
directed network (有 向 网 络 ) 

wave algorithm for (波动 算法 ) , 197 
direction, sense of (方向 , (GT) , 565 
discrete logarithm (Bit) ,486 

ElGamal’s scheme (ElGamal 模 式 ) ,486 
distance (距离 ) ,557 
distributed algorithm (definition) ( 分布 式 算法 定义 ) ， 
46 
distributed database (分 布 式 数 据 库 ) , 7,354 
commit-abort (交付 异常 中 断 ) ,432 
deadlock (Æ) , 354 
distributed system (分 布 式 系统 ) ,2 
Dolev-Klawe-Rodeh algorithm ( Dolev-Klawe-Rodeh $i 
ik) ,238 | 
drift (漂移 ) , 100, 404, 494 
duplication of a message (消息 复制 ) , 67, 225 
dynamic topology (动态 拓扑 结构 ) , 65, 522 


early stopping (提前 停止 ) ,492 

echo algorithm (al 波 算法 ) , 225,248 

edge (W) , 556 

edge function (HAR) ,541 

election (选举 ) , 10,227, 432 
{k, l]-election ({k, 1 -选举 ) , 467 
Chang-Roberts alg. (Chang-Roberts 算 法 ) , 234 
fault-tolerant (容错 ) , 444 
Gallager-Humblet-Spira alg. 
Gallager-Humblet-Spira®t 7: ) , 249 
in hypercube ( 超 立 方 体 ) ,267 


in planar graph (CERIK) .267 
in torus (A) , 267 
Korach-Kutten-Moran alg., (Korach-Kutten-Moran 算 
法 ) ,260 
LeLann’ s alg., (LeLann 算 法 ) ,233 
match-making (hypercube) (进行 比赛 ( 超 立 方 
体 )) ,375 
Peterson's alg.，( Peterson 算 法 ) , 238 
using traversal ( 利用 遍 方 ) ,260 
ElGamal’s signature scheme (EjGamal 签名 模式 ) ,486 
empty path (ERIZ) ,541 
emulation (failure det.) (竞争 , 故障 俭 测 ) ,517 
enabled action (能 行 行为 ) ,554 
environment (环境 ) , 276 
equivalent of executions (~) (执行 等 价 ) ,59 
Ethernet (LLAKI) ,9 
Euler’s phi function (Euler’s F 4%) ,487 
event ( 事件 ) , 45,47 
corresponding ( 对应) , 54 
internal (内 部 ) , 45 
postshot (后 照 ) , 337 
receive (接收 ) , 46 
send (发 送 ) , 46 
event-driven notation (上 事件 驱动 表示 法 ) , 554 
eventual strong accuracy (最 终 强 精确 性 ) , 507 
eventual week accuracy (最 终 弱 精确 性 ) . 508 
eventually perfect failure det.( 最终 完 美 故障 检测 ) ,508 
eventually strong failure det. ( 最终 强 故障 检测 ) ,508 
execution ( 执行) ,45 
exhaustive set ( 穷 举 集 ) ,242 
explicit termination ( 显 式 终止 ) ,268 
extinction (停止 ) , 246, 267 
extrema-finding problem ( 极 值 搜索 问题 ) , 229 


failure detector (故障 检测 器 ) , 505 
history ( 历史 纪录 ) , 507 
failure pattern (故障 模式 ) , 506 
fair collateral composition (公平 并 组 合 ) , 537 
fair execution (t-crash ) (公平 执行 ,t 损 毁 ) , 438 
fair execution (t-initially-dead ) (公平 执行 , -初始 - 死 
È) , 442 
fair scheduling (公平 调度 ) , 452 
fairness assumption (公平 性 假设 ) , 49, 80 
fast-convergence algorithm (快速 收敛 算法 ) , 497 
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father ( 父 节 点 ) , 560 
fault model (故障 模型 ) , 429 
Byzantine, 429 
crash 〈 损毁) ,429 
hierarchy (分 层 ) ,430 
initially dead (初始 死记 的) ,429 
omission ( 省 略 ) , 430 
timing (定时 ) ,431 
fault tolerance (容错 ) ,437 
stabilizing algorithm (RER ) ,522 
feasible snapshot ( 可 行 快照 ) , 338 


Fiat-Shamir signature scheme (Fiat-Shamir 签 名 模式 ) , 


488 

fifo channel (先进 先 出 信道 ) ,67 

file-transfer protocol (FTP) (文件 传输 协议 ) ,20 
Finn’s algorithm (Finn 算 法 ) , 225, 232 
firing-squad problem (触发 组 问题 ) ,491 
Floyd-Warshall algorithm (Floyd-Warshall 算 法 ) , 110 
flush channel( 祷 仓 信道 ) ,67 

follower (追随 者 ) , 183 

forall statement (forall 语 句 ) ,551 

forest ( 森林) ,561 

fork (分 支点 ) ,439 

forward-count controller (前 向 计数 控制 器 ) , 167 
forward-state controller (前 向 状态 控制 器 ) , 168 
forwarding of a packet ( 包 转 发 ) , 156 

fragment of an MST (MST 碎 片 ) , 250 

frame (Hi) ,21 

fromthis (in receive statement ) 

(从 这 个 进程 , 在 接收 语句 中 ) , 552 

frond edge ( 非 树 边 ) , 137,560 

full channel (全 信道 ) , 68 


Gallager-Humblet-Spira MST algorithm 
(Gallager-Humblet-Spira MST 算 法 ) , 249 
gamma synchronizer (g 同 步 器 ) ,411 
garbage collection (废料 收集 ) , 16,346 
garbling of a message (消息 碎片 ) , 67, 76 
gateway (网 关 ) ,6 
general (通用 ) , 462, 471 
generation of a packet (HÆR) , 156 
generator (of a group) (组 生成 器 ) , 486 
global state (全 局 状态 ) 45 

lack of (缺少 ) ,27 


global time (全 局 时 间 ) ,396 
jack of (缺少 ) ,27 
global virtual time (全 局 虚拟 时 间 ) .349 
global-marking algorithm ( 全 局 标记 算法 ) ,351 
graceful degradation (体面 降级 ) ,428 
graph (图 ) , 64, 557 
greedy routing ( A 4ER HH) . 366 
grid (网 格 ) , 563 

routing (路 由 ) , 144 
group (algebra) (和 群 ,代数 ) ,357 “ 
group membership (组 成 员 资 属 ) ,435 
group sense of direction (组 方向 侦 听 ) ,358 
guaranteed path ( 保障 路 径 ) . 159 
guard (ofan action) (FAMA) ,554 


Hamiltonian cycle (哈密 尔 顿 回路 ) , 559 
harmonic number ( 调和 数 ) ,237, 266 
heartbeat failure detector (心跳 故障 检测 器 ) ,517 
hierarchical routing (分 级 路 由 ) , 149 
hops-so-far scheme ( 当前 跳 数 模式 ) , 162 
hops-to-go scheme (下 一 跳 数 模式 ) , 163, 177 
hypercube ( 超 立 方 体 ) ,65, 563 

anonymous (Æ) , 323 

controller for (控制 器 ) , 177 

election in (选举 ) ,267, 422 

interval routing in (区 间 路 由 ) , 145 

match-making (进行 比赛 的 ) ,375 

sense of direction in (方向 侦 听 ) , 206, 568 

traversal algorithm for, GADA?) , 205 


identity (标识 ) , 69 

IEEE standards (IEEE 标 准 ) , 20, 23 

ILS, interval labeling scheme (区 间 标 号 模式 ILS) , 137 
image (图 像 ) , 159 

IMP (interface message processor) (接口 信息 处 理 机 
IMP) ,6 

implicit message ( 隐 式 消息 ) , 399, 405 

implicit termination ( 隐 式 终止 ) , 268 

in-neighbor ( 人 近邻 ) , 558 

incident edge (依附 边 ) , 557 

incoming edge (入 边 ) , 558 

index (索引 ) , 486 

indirect addressing (间接 定 址 j〗 , 69,553 

induced subgraph (导出 子 图 ) , 557 
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inexact agreement ( 非 精 确 - 一 敏 性 ) . 497 
infimum (下 确 界 ) ,188 
infimum computation ( FR it) , 189 
infimum theorem ( FAE) , 190 
initial configuration( 初始 配置 ) .45,46 
initially dead process ( 启动 先进 程 ) , 429 
initiator (初始 者 ) . 183 
input collection (输入 集合 ) ,318 
interactive consistency (461. --ScH#E) ,492 
interface message processor (IMP) (接口 消息 处 理 机 
(IMP)) ,6 
internal events (内 部 事件 ) ,45 
Internet ( 因特网) ,6 
interval labeling scheme (区 间 标 号 模式 ) ,137, 225 
depth-first search (深度 优先 搜索 ) , 138 
for a grid (BHR) , 144 
for a hypercube (# v Fitk) , 145 
for a ring (3h) , 143 
for an outerplanar network ( 外 平面 网 络 ) , 145 
linear (线性 ) , 142 
valid ( 有效) ,137 
interval routing (BRAH) ,137 
efficiency of (效率 ) , 140 
linear (线性 ) , 142 
multi-dimensional ( 多维) , 146 
neighborly (近邻 的 ) . 141 
optimal (最 优 的 ) , 143 
invariant ( 不 变 式 ) ,51,72 
ISO standard (ISO 标准 ) ,20 
Itai-Rodeh algorithm (election) 
(ltai-Rodeh 算 法 (选择 )) . 323 
Itai-Rodeh algorithm (ring size) 


(Itai-Rodeh 算 法 ( 环 长 度 )) , 329 


key (for signature) ( 钥匙, 签名 ) ,485 
knot (4%) , 444 


Korach-Kutten-Moran algorithm (Korach-Kutten-Moran 
算法 ) , 260 
Kruskal’s MST algorithm (Kruskal MST 算 法 ) , 250 


Lai-Yang algorithm (Lai-Yang 算 法 ) , 342 

Lamport’s logical clock (LamportiB tt 3p) , 62, 304 
LAN (local-area network )，( 局 域 网 ) 3 

Las Vegas algorithm (Las Vegas 算法 ) ,313, 452 


layer (H) ,18 

leader (领导 人 ) , 228 

legitimate configuration (@#:Ad) . 521 
LeLann’s algorithm (LeLann 算 法 ) , 233 

length (长 度 ) .557 

length-increase (长 度 增加 ) . 542 

lexicographic order (字典 序 ) ,72 

lieutenant (中尉 ) ,471 

line of processors ( 处理 器 线 ) ,309 

linear ILS (线性 ILS) , 141 

linear-interval routing (线性 区 间 路 由 ) , 142 

link register (链接 寄存 器 ) ,524 

livelock ( 话 锁 ) , 174 

liveness (活动 性 ) ,50, 52 

load balancing ( 负载 平衡 ) , 14 

local algorithm ( 局 部 算法 ) , 46 

local causal order ( 局 部 因果 序 ) ,336 

local snapshot ( 局 部 快照 ) ,336 

local-area network ( 局域网 ) ,4,8 

(局 域 网 (LAN)) ,3 
locking (in database) (数据 库 中 加 锁 ) ,354 
lockstep operation ( 锁 步 操作 ) ,396 

logical link control sublayer (i 2H 5424 #0 til (JB) ,24 
long-haul network (远程 网 络 ) .3 

loss of a message (消息 损失 ) ,67 

low-diameter spanning tree (小 直径 生成 树 ) ,560 


local-area network (LAN) 


malign failure (EHER) , 430 
mask (WERB) , 382 
match-making algorithm (进行 比赛 的 算法 ) ,375 
matching (in graph) (匹配 ) ,530 
Mattern’s vector clock (Mattern 向 量 有 时钟 ) ,63 
Mattern, credit-recovery algorithm, 299 
maximal matching (最 大 匹配 ) ,530 
maximum packet lifetime (最 大 包 生 存 期 ) ,87, 172 
meaningful snapshot ( 有 意义 的 快照 ) ,339 
medium-access-control sublayer (介质 访问 控制 子 层 ) ， 
23 
Merlin-Segall algorithm (Merlin-Segall 算 法 ) , 120 
message ( 宵 息 ) ,46, 551 

broadcast (广播 ) ,26 

implicit ( 隐 式 ) ,399 

multicast (组 播 ) ,26 

point-to-point (点 到 点 ) ,26 
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postshot (后 照 ) , 338 

preshot (前 照 ) , 338 
message chain (消息 链 ) . 223 
message passing (消息 传递 ) , 44,523 
message termination (消息 终止 ) , 268 
message-generation function (消息 牛 成 函数 ) , 398 
MIMD (多 指令 多 数据 ) ,12 


minimal spanning tree (MST) (最 小 牛 成 树 (MST)) , 


249 
minimal-path forest (fe AIBA TERR) , 542 
minimal-path problem 〈 基 短路 径 问 题 ) ,541 


minimal-weight spanning tree ( 季 小 加 权 生 成 树 ) , 249, 


560 

minimal-delay routing (最 小 延迟 路 由 ) . 104 
minimal-hop routing (最 小 跳 数 路 由 ) , 104 
mixed-failure model (混合 故障 模型 ) ,430 
monitor ( 管 程 ) , 17 

monotonicity (单调 性 ) , 541 

Monte Carlo algorithm (Monte Carlo 算 法 ) ,313 


MST (minimal spanning tree) (MST (BERA )) ， 


249 

multi-dimensional interval routing (多维 区 间 巾 由 ) , 146 
multi-source algorithm (多 源 算法 )，183 

multicast message (组 播 消 息 ) , 26 

multiple interval algorithm (多 路 区 间 算 法 ) ,142 
multiple-instruction multiple-data (MIMD) ，( 多 指令 多 
数据 (MIMD)) ,12 

multiple-path routing ( 多 路 径路 由 ) , 109 
multiprocessor computer ( 多 处 理 器 计算 机 ) , 11 
multisets (M (A)) (4 (M(A))) ,46 

mutual exclusion ( 互 斥 ) , 11,524 


named network (命名 网 络 ) ,69 
neigh ( 相 邻 ) ,551 
neighbor (近邻 ) , 64,551,557 
neighbor knowledge (近邻 知识 ) , 69 

depth-first search using (用 深度 优先 搜索 ) ,216 
neighborly ILS (近邻 ILS) , 141 
neighborly interval routing (近邻 区 间 路 由 ) , 141 
Netchange algorithm (变更 算法 ) , 123, 153, 523, 545 
network ( 网络) , 64 
anonymous (匿名 ) , 69,307 


asynchronous bounded-delay (ABD) (异步 有 限 延 迟 ) , 
400 


dynamic (动态 ) .522 
named (命名 的 ) ,69 
synchronous (同步 的 ) , 398 
node ( 他 点 ) ,2,556 
network layer (网络 层 ) ,21, 156 
non-determinism ( 非 确 定性 ) , 28, 309 
non-triviality ( 非 平 凡 ) ,431 
for consensus algorithm ( -一 致 算法 ) ,438 
for decision task ( MEES ) ,450 
norm function ( 范 图 数 ) , 52, 130, 139 


omission failure (省略 故障 ) , 430 
one-time complexity (单位 时 间 复 杂 度 ) , 221 
open-systems interconnection (OSI) (开放 系统 万 连 ) ， 
20 
optimal ILS (最 优 ILS) , 141 
optimal sink tree (ULI RB) ,108, 136, 560 
optimistic fault tolerance (乐观 容错 ) , 520 
OR modei (deadlock) (OR 模 型 , 死 锁 ) . 354 
order-preserving renaming (保持 顺序 的 重 命名 ) , 446, 
449 
orientation (定向 ) , 163 
OSI (开放 系统 互 连 ) , 20 
out-neighbor (出 近邻 ) , 558 
outerplanar graph (外 平面 图 ) . 557 
interval routing in (区 间 路 由 ) ,145 
outgoing edge (出 边 ) , 558 


pacing deadlock ( 步 死 锁 ) , 173 

packet ( 包 ) ,77 

parallel composition ( 并 行 组 合 ) ,72 

parallel random-access memory (PRAM) (并 行 随机 访 
问 存储 器 ) ,14 

parent ( 父 节 点 ) , 560 

partial failure ( 部 分 故障 ) ,3, 428 

path (路 径 ) , 557 

Peleg’s algorithm (election) (Peleg 选 举 算法 ) , 232 
perfect failure detector (完美 故障 检测 器 ) ,508 
permanent failure (永久 故障 ) ,436 

pessimistic fault tolerance (悲观 容错 ) , 520 

Peterson’s election algorithm (Peterson 选 举 算 法 ) , 238, 
266 

physical layer (物理 层 ) . 20,23 

piggybacking (444F) , 301, 343 





382 FM FG] 








pipe (管道 ) ,17 
planar graph (平面 图 ) ,557 
coloring of (着 色 ) , 538 
election in (选举 中 ) , 267 
point-to-point message (点 到 点 消息 ) . 26 
point-to-point network (点 到 点 网 络 ) ,6 
polling algorithm ( 轮 询 算 法) , 196 
possible configuration ( 可 能 配置 ) ,338 
postshot event (后 照 事件 ) , 337 
postshot message (后 照 消 息 ) ,338 
PRAM, 14 
precision (精度 ) ,494 
prefix ( 3) (M) , 147 
prefix labeling scheme ( 前缀 标号 模式 ) ,147, 224 
tree (BL) ,147 
valid (有效 的 ) , 147 
prefix routing (前 缀 路 由 ) , 146 
presentation layer (表示 层 ) ,22 
preshot event (前 照 事 件 ) ,337 
preshot message (前 照 消息 ) , 338 
Prim’s MST algorithm (Prim MST 算 法 ) ,250 
primitive root (A JHE) , 486 
private key ( 私 钥 ) , 485 
probabilistic algorithm (概率 算法 ) , 308 


probabilistic consensus algorithm (概率 -- 致 性 算法 ) ， 


453, 458 
probabilistic process (随机 过 程 ) , 309 
process (进程 ) , 46 
deterministic (人 确定 性 的 ) , 309 
probabilistic ( 概率 性 的 ) , 309 
synchronous ( 同步) ,398 
process identity ( 进程 标识 ) ,69 
process termination (进程 终止 ) ,268 
producer-consumer problem (生产 者 消费 者 问题 ) , 16 
progeny deadlock ( 子 代 死 锁 ) , 173 
propagation of information with feedback (具有 反馈 的 信 
息 传播 ) ,187 
protocol (协议 ) .19 
pseudo-anonymous network (人 擅 - 匿 名 网 络 ) ,333 
pseudo-stabilization ( 伪 - 稳 定性 ) , 523 
pseudocode ( 伪 代 码 ) ,551 
public key ( 公 钥 ) , 486 
pulse (kòt) ,397, 470 
pulse complexity (脉冲 复杂 度 ) ,492 


pulse time (脉冲 时 间 ) ,404 


Rana’s algorithm (Rana 算 法 ) ,302 
randomization (随机 化 ) ,309 
reachable ( 可 达 的 ) ,45 
in Byzantine model, 456 
read-all ( 读 所 有 ) , 524 
read-one ( 读 一 个 ) .524 
realtime (实时 ) ,493 
real-time clock (实时 时 钟 ) , 62 
reassembly deadlock (重组 死 锁 ) , 174 
receive events (接收 事件 ) ,46 
receive statement (接收 语句 ) , 552 
receive-fromthis statement (fromthis 接 收 语句 ) ,552 
regular graph (正则 图 ) , 557 
reliable channel ( 可 靠 信道 ) , 66 
remote procedure call (远程 过 程 调用 ) , 26 
renaming problem ( 重 命名 问题 ) , 446 
order-preserving ( 保 序 的 ) ,446, 449 
replay argument ( 重 放 证 明 ) ,320, 323 
resilience ( 弹 回 ) ,438 
resource allecation (资源 分 配 ) , 11 
resource deadlock (资源 死 锁 ) , 354 
restricted-degree spanning tree ( 度 受 限 的 生成 树 ) ,561 
ring ( 坏 ) , 65,559 
controller for (控制 器 ) , 164 
election in (选举 ) , 232, 265 
orientation (定向 ) ,527 
routing for (路 由 ) . 143 
sense of direction in (Fy (HM) , 566 
termination detection in (41k AM) , 285 
wave algorithm for (波动 算法 ) , 190 
Rivest-Shamir-Adleman scheme (Rivest-Shamir-Adleman 
模式 ) , 488 
robust algorithm (健壮 算法 ) , 429 
rooted tree (有 根 树 ) , 560 
rotating coordinator (旋转 协调 器 ) , 510 
round (循环 ) ,470 
round complexity ( 循环 复杂 度 ) ,492 
round-robin (ER) ,23 
routing (路 由 ) ,8, 104 
compact (压缩 ) , 132 
hierarchical (分 级 的 ) , 149. 
minimum-delay ( 节 小 延迟 ) , 104 
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minimum-hop ( ik) Pb%) , 104 
shortest-path ( 最 短路 径 ) , 104 
Update algorithm (更 新 算法 ) , 545 
routing tables (路 出 表 ) , 103 
RSA signature scheme (RSA RA) ,488 
rubber band transformation (R Akt) ,59 


safety (安全 ) ,50 
Safra’s algorithm (Safra 算 法 ) .289 


Santoro-Khatib tree-labeling (Santoro-Khatib 树 标号 ) ， 


133,414 
scalable organization ( 可 扩展 的 组 成 ) ,9 
secret key ( 密 钥 ) ,485 
selective delay (选择 性 延迟 ) . 400, 406 
self-stabilization ( FI Ria) ,521 
self-stabilization algorithm ( 自 稳定 算法 ) . 435 
semaphore (443) ,17 
send event (发 送 事 件 ) . 46 
send statement (发 送 庄 铝 ) , 552 
sending window (iS BIT) ,82 
sense of direction (方向 侦 昕 ) , 69, 565 

group (分 组 ) , 358 

in clique (WH) , 567 

in hypercube 〈( 超 立方 体 ) , 568 

inring ( 环 ) ,566 

in torus (BJS) ,568 

ring (3K) ,527 
sequence number (序号 ) ,77 
session layer (会 话 层 ) ,22 
shared variables (共享 变量 ) ,44, 524 
Shavit-Francez algorithm (Shavit-Francez 算 法 ) ,280 
Sherwood algorithm (Sherwood 算 法 ) , 312 
shortest-path routing ( 最 短路 径路 由 ) , 104 

with Netchange algorithm (变更 算法 ) , 132 
signature scheme (签名 模式 ) , 482 

EliGamal , 486 

Fiat-Shamir, 488 

Rivest-Shamir-Adjieman, 488 
signing (of a message) (签名 (消息 )) ,482 
SIMD ( 单 指令 多 数据 ) , 12 
simple cycle (简单 癌 路 ) ,557 
simple mail-transfer protocol (SMTP) (简单 邮件 传输 协 
议 ) ,20 
simple path ( 简单 路 径 ) ,557 


simultaneity ( 同时) 
for broadcast algorithm (广播 算法 ) ,471 
for firing-squad algorithm (触发 组 算 法 ) ,491 
single-instruction, multiple-data (SIMD) ( 单 指令 多 数 
据 ) ,12 
single-source algorithm (单数 据 源 算法 )，183 
sink tree (汇集 树 ) , 108 
optimal ( 最 优 ) , 108, 136, 560 
six-color theorem (6- 色 定理 ) , 538 
size of routing table (路 由 表 大 小 ) . 150 
SMTP, 20 
snapshot (快照 ) , 335 
feasible ( 可 行 的 ) , 338 
meaningful ( 有 意义 的 ) ,339 
snapshot state (快照 状态 ) ,336 
son ( 子 ) ,560 
source of a packet ( 包 源 ) , 156 
Space Shuttle (航天 飞机 ) , 428 
spanning subgraph (生成 子 图 ) . 557 
spanning tree (/E AE) , 560 
low diameter (小 直径 ) , 560 
specification (规范 ) , 521 
square root (平方 根 ) , 488 
stabilization (稳定 性 ) ,521 
stabilizing algorithm (稳定 算法 ) , 435 
stable property (稳定 性 质 ) , 335, 346, 351 
star (Æ) , 65,561 
starter ( 启动 器 ) , 183 
state model (状态 模型 ) , 524 
state of a process (进程 的 状态 ) ,46 
static topology (静态 拓扑 结构 ) ,65 
step (Æ) ,440 
store-and-forward deadlock (存储 转发 死 锁 ) , 155 
store-and-forward network (存储 转发 网 络 ) ,8 
strong accuracy ( 强 精确 性 ) , 507 
strong completeness ( 强 完全 性 ) , 507 
strong failure detector ( 强 故障 检测 器 ) , 508 
strong fairness ( 强 公平 性 ) ,49 
strongly connected graph ( 强 连 通 图 ) , 558 
subgraph ( FÆ) ,557 
subtree ( 子 树 ) , 560 
suitable (buffer) (适合 的 (缓冲 区 )) ,159 
superimposed algorithm (INR) .271 
symmetric configuration ( 对 称 配置 ) ,317 
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symmetric system ( 对称 系 统 ) , 309 
synchronization (同步 ) , 10, 188, 408 

‘ABD network (ABDI) . 401 

for fault tolerance (容错 ) , 434 
synchronizer (同步 器 ) , 397,401,434, 470 
synchronous computation (同步 计算 ) , 399 
synchronous message passing (同步 消息 传递 ) , 47 
synchronous process (同步 进程 ) , 398 
synchronous system (同步 系统 ) ,397 
decision graph of ( 判定 图 ) ,449 
Tarry’s traversal algorithm (Tarryi i (算法 )) , 207 
task (任务 ) , 433, 445 

connected (连通 的 ) , 450 


TCP/IP protocol (TCP/IP 协 议 ) , 20 
terminal configuration (终端 配置 ) . 45, 268 
termination (A jk) ,431 
for broadcast algorithm (广播 算法 ) . 471 
for consensus algorithm ( 一致 性 算 靶 ) , 438 
for decision task (判定 任务 ) ,445 
for firing-squad problem (触发 组 问题 ) ,491 
for interactive consistency ( 灾 互 一 致 性 ) ,492 
termination detection (终止 检测 ) , 10, 268, 346 
with token algorithm ( 令 牌 算法 ) , 285 
with wave algorithm 〈 波 动 算 靶 ) , 273 
time complexity (时 间 复 杂 度 ) ,209 
alpha-time (a 时 间 ) ,223 
chain-time ( 链 时 间 ) ,223 
one-time (单位 时 间 ) ,221 
timer (计时 器 ) ,87 
timing error (定时 错误 ) ,431 
token algorithm ( 令 牌 算法 ) 
for election (选举 ) ,233, 260 
for ring (3) , 190 
for termination detection (终止 检测 ) , 285 
traversal (WHJ) ,203 
token bus ( 令 牌 总 线 ) , 23 
token ring ( 令 牌 环 ) ,9, 23 
topological awareness (拓扑 意识 ) ,565 
topological information (拓扑 信息 ) , 69 
topology (拓扑 学 ) , 64,556 
torus (WH) , 563 
anonymous (E) , 323 
election in (选举 ) , 266, 267, 422 


sense of direction in (方向 侦 听 ) , 204, 568 
traversal algorithm for (遍历 算法 ) , 204 
Toueg’s algorithm (Toueg 算 法 ) , 113,399 
trace (PREZ) , 242,319 
transaction, database (事务 , 数据 库 ) , 354 
transient failures (瞬时 故障 ) , 520 
transition (444%) , 45, 46 
for probabilistic algorithm (概率 算法 ) ,310 
for stabilizing system (稳定 系统 ) ,521 
for synchronous system (同步 系统 ) ,399 
transport layer (传输 层 ) ,21,75 
Transputer, 12, 145, 308 
traversal algorithm (过 历 算法 ) , 181, 184, 202 
election with (选举 ) , 260 
tree ( 树 ) , 65,560 
controller for (控制 器 ) , 166 
election for (选举 ) ,230 
routing for (路 由 ) , 133 
wave algorithm for (波动 算法 ) , 191 
tree edge ( 树 边 ) , 560 
tree-labeling scheme ( 树 标 号 模式 ) ,133,414 


underlying computation (六 在 计算 ) ,271 
undirected graph (无 向 图 ) ,557 

uniform stabilizing algorithm (- -和 伊 稳 定 算法 ) , 526 
univalent configuration (单价 配置 ) ,438 

UNIX system (UNIX 系 统 ) ,6 

Update algorithm (更 新 算法 ) ,543 

UUCP network (UUCP 网 络 ) ,6 


validity for firing-squad problem (触发 组 问题 的 有 效 
性 ) , 491 

vector clock (向 量 时 钟 ) , 63 

vector order (REMF) , 63 

vector-counting algorithm (向 量 计 数 算法 ) , 293 
virtual ring ( #3) ,559 

visit (of a wave) (波动 访问 ) .297 


wait-free atomic variables (无 等 待 的 原子 变量 ) , 16 
WAN (wide-area network) (广域网 ) ,3 
wave algorithm (波动 算法 ) , 181 
centralized versus decentralized (集中 式 与 分 散 式 ) ， 
218 
definition (定义 ) ,182 
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echo algorithm (lk PY) , 194 use in termination detection (终止 检测 中 使 用 ) , 273, 
for arbitrary network (任意 网 ) , 246 281, 297 

for clique (H) . 196 weak accuracy (39% at) , 507 

for directed network (有 向 网 络 ) . 197 weak completeness (failure det.) (S93¢2: th, 故障 愉 
for hypercube ( 超 立 方 体 ) . 205 测 ) ,517 

for ring ( 坏 ) , 190,245 ~ weak fairness ( 弱 公 平 性 ) ,49 

for torus (PUSH) , 204 。 weighted graph ( 带 权 图 ) ,558 

for tree ( 树 ) .191 well-founded set ( 良 基 集 ) , 53,72 

overview (SiR) ,218 wide-area network (广域网 ) ,4,6 

phase algorithm 《相位 算法 ) , 197 wide-area network (WAN) (广域网 ) ,3 

polling algorithm ( 轮 询 算法 ) . 196 window (窗口 ) .82 


use in election (选举 中 使 用 ) , 230 witness (证据) .453 


